2007年11月3日のブックマーク (2件)

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
    tokyocat
    tokyocat 2007/11/03
  • 数苦を経て数楽へ - 書評 - 数学する精神 : 404 Blog Not Found

    2007年11月03日01:00 カテゴリ書評/画評/品評Math 数苦を経て数楽へ - 書評 - 数学する精神 数学は、コーヒーのようなものなのかも知れない。 数学する精神 加藤文元 その苦みが味わえるようになって、やっと楽しめるようになるという点において。 書「数学する精神」は、数学者が数学するときの気持ちを、読者に読ませるようにというより、著者が書きたいように書いた。書きたいように書く妨げにならないための配慮か、書は数式も遠慮なく登場し、それを無理なく登場させられるように横書きになっている。 p. 10 このは一般向けにわかりやすく数学を解説したというよりは、むしろ「数学」そのものについてのであり、数学についての筆者の個人的な思想や信条(そして心情も!)を率直に告白したである。 目次 はじめに 第1部 人間と数学 第1章 計算できる記号 第2章 ウサギとカメ 第3章 ビ

    数苦を経て数楽へ - 書評 - 数学する精神 : 404 Blog Not Found
    tokyocat
    tokyocat 2007/11/03