タグ

2013年4月7日のブックマーク (2件)

  • 『統計が弱いので』 - ryamadaの遺伝学・遺伝統計学メモ

    「統計が弱いので教えてほしい」という依頼 全部で4時間 基礎医学から臨床医学までの雑多な大学院生と教官の集まり 「予習課題を出してもいいですか?自分はどんなデータをもっていて、それについて、解析してみることを課題にしておきましょう」と言ったら、「そんな難しいことはできない」と さて、ここには色々な問題が潜んでいますが、それを粉砕しつつ、できる限り、実のある4時間にするにはどうしたらいいものか まずは『統計が弱いので』という幻想をなくそう 『統計が弱い』のではなく、『戦略が間違っている』のではないでしょうか 以下、その要点を説明する 統計学とは データ学としての統計学 実践スキルとしての統計学 実践スキルとしの統計学 だれにどうやって習うべきか 何をどうやって学ぶべきか エクセルの使い方を習うために、計算機科学の教授について学ぶべきか、アビバに行って学ぶべきか あなたの課題はなんですか? 統

    『統計が弱いので』 - ryamadaの遺伝学・遺伝統計学メモ
  • 文字コード変換ミスによる文字化けパターンと想定される原因 - drk7jp

    とあるシステムでデータベースから引いてきたデータの表示が文字化けするという不具合がありました。 データベース内のデータとしては文字化けしていない状態で格納されていることはわかっていたので、どこかしらの文字変換で化けていることはわかっています。まずはどの誤変換により文字化けするのか原因切り分けのために、decode/encode の組み合わせによる文字化けパターン一覧を作りました。おかげさまでどのパターンに類するものか判別することができ、無事に改修することができました。 その話はまた別にするとして、今も昔も変わらず文字化けに悩む人は意外と多いと思います。誤変換結果一覧は原因解析の参考になると思い、記事としてまとめることにしました。 文字コード変換ミスによる文字化けパターンを可視化するプログラムと一覧表 まずは誤変換を生成する perl スクリプトです。プログラムはとっても簡単で、「文字化けで