Google の日本語解析データ - 傀儡師の館.Python：楽天ブログ

テクノロジーカテゴリーの変更を依頼記事元:

plaza.rakuten.co.jp/kugutsushi

2 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Google の日本語解析データ - 傀儡師の館.Python：楽天ブログ

2007.11.03 Google の日本語解析データカテゴリ：ことばの処理グーグルが大規模な日本語の解析データ... 2007.11.03 Google の日本語解析データカテゴリ：ことばの処理グーグルが大規模な日本語の解析データを公開、「20％ルール」の成果グーグルでは、200億文に上る日本語データを解析したという。含まれている単語は、約2550億個。1～7gramのデータを公開しており、例えば7-gramのデータは11億種類以上にも上る。 Google Japan Blog: 大規模日本語 n-gram データの公開を読む。すごいなぁ。特定非営利活動法人言語資源協会の GSK2007-C Web日本語Nグラム第1版で公開されているのね。といっても無料じゃないけど。「抽出対象となった文数は約200億文で、出現頻度20回以上の１～７グラムを収録している。」で DVD-R 6枚の 26GB（gzip で圧縮した状態で）。すごい量だな。ちなみに個人・非会員42,000円か。んー、個人でも会員

ブックマークしたユーザー

morioka2007/11/04
nyancy10112007/11/03

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx