タグ

自然言語処理と思考に関するt-murachiのブックマーク (1)

  • ぶっこ抜き? [Google日本語入力の功罪]

    [PR] ブログの商品紹介リンクには広告が含まれています お仕事で四国から飛んで帰っている間にGoogle様が「Google日本語入力」をリリースしていました(Google様のブログ参照)。 ATOK とか MS IME とかと同じ役割をする、かな漢字変換エンジン。WindowsMac の両方揃って、どちらも無料です。 まだ現物は試していないのですが、上記のブログの説明や Twitter に流れている試した人の感想を読む限りでは、かなりすごい。破壊的にすごい。 Google が蓄積している Web 上のテキストの膨大なデータを辞書に使っていて、Web から機械的・自動的に辞書を生成することで、人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録しています。高い変換精度を実現するために、Web 上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成

    t-murachi
    t-murachi 2009/12/03
    例えば ATOK は「正しい日本語」を売りにしている。間違っているけどよくしてしまう読みで書いて変換しようとすると、正しい読み方を教えてくれたりする。GoogleIME の技術背景が本記事の指摘通りだとするとそれは不可能
  • 1