ブックマーク / blog.google (2)

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
    sumiisan
    sumiisan 2007/11/02
    なんですと!
  • Google ガジェット API - スタート ガイド

    Technology creates tremendous opportunities to improve people’s lives. But to make the most of them, we need to focus—or we end up doing too much and not having the impact we strive for. So last fall we started a spring clean, and since then we’ve closed or combined more than 30 products. Today we’re announcing a few more closures. Here’s a summary of the changes we’ll be making: The Google Mini h

    Google ガジェット API - スタート ガイド
    sumiisan
    sumiisan 2006/07/25
    なんかつくってみよっと
  • 1