Googleが10兆語のデータから作成したn-gram(n単語列)の出現回数などを記録したデータを研究用途向けに配布するそうです[link]。機械翻訳、スペリングチェック、情報検索、構文解析、意味抽出、音声認識などなど用途は広いですね。クローリングして良質のデータを集めるのは一苦労なので、使ってみるとおもしろそう。 #All Our N-gram are Belong to You についてはここ参照。本タイトルではもう一回日本語に訳しなおしてみました
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く