「Web から抽出した約200億文(約2550億単語)の日本語データから作成したn-gramデータ(1~7 gram)を公開」。「言語資源協会(以下、GSK)の言語資源流通サービスを利用」して配布、「団体・個人の区別なく」利用可。

facetfacet のブックマーク 2007/11/03 00:55

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

Google Japan Blog: 大規模日本語 n-gram データの公開

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう