タグ

ブックマーク / id.fnshr.info (3)

  • オンラインで無料で読める統計書22冊|Colorless Green Ideas

    はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれたが多いが、日語で書かれたも若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

    オンラインで無料で読める統計書22冊|Colorless Green Ideas
  • 言語研究者のための統計の学び方―基礎を身につける|Colorless Green Ideas

    総和 総和と言っても、ピンと来ない人もいる。要するに与えられた規則に基づいて、数を足していくだけの話なのだけれども、慣れないとどういったものだか分かりづらいところがある。 総和記号の使用例 \[ \sum_{n=3}^{7} 2i = 2 \cdot 3 + 2 \cdot 4 + 2 \cdot 5 + 2 \cdot 6 + 2 \cdot 7 \] いずれにせよ、統計の教科書では、総和の記号がよく出てくるので、総和記号の取り扱いに把握しておくと統計が理解しやすくなる。高校の教科書だと、普通、数列について扱っている章に載っている。 組み合わせ論と確率 組み合わせ論と確率については、統計の入門書にもしっかり載っているので、特に力を入れる必要はないと思う。「そう言えばこんな感じなのだな」と、軽く確認するだけで十分だ。 対数 言語現象は対数の形で表されることが多いので、しっかり把握しておくこ

  • 文字列の類似度を測る(1) レーベンシュタイン距離|Colorless Green Ideas

    ある文字列と別の文字列の類似度を測る手法の1つである、レーベンシュタイン距離について紹介する。文字列の類似度は検索エンジンやDNAの塩基配列の調査などにも使用されており、応用範囲は広い。 はじめに Googleの検索結果の訂正候補 検索サイトで検索語を間違えて入力してしまった場合、検索エンジンが訂正候補を出してくれることがある。図に掲げた例では、「マクドナルド」と入力しようとして、誤って「マクラナルド」と入力してしまっているが、Google は「マクドナルド」の検索結果を返している。誤ったものを入力すると、その誤ったものと似た正しいものを返しているのである。 このように訂正候補を出すには、まず入力されたものと似ているものを探し出すということが必要になる [1] 。そして、似ているものを探し出すには、何をもって似ているとするのかということを決めなくてはならない。つまり、類似度の尺度が必要とな

  • 1