エントリーの編集
![loading...](https://b.st-hatena.com/f27c0b793148c4c51ce0d5c7a77dd5e10c208478/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
http://www.gsk.or.jp/catalog/GSK2007-C/GSK2007C_README.utf8.txt
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/f27c0b793148c4c51ce0d5c7a77dd5e10c208478/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
http://www.gsk.or.jp/catalog/GSK2007-C/GSK2007C_README.utf8.txt
Web日本語Nグラム第1版 Copyright 2007 Google Inc. All Rights Reserved 1. 概要 「Web日本語Nグラム... Web日本語Nグラム第1版 Copyright 2007 Google Inc. All Rights Reserved 1. 概要 「Web日本語Nグラム」は日本語の単語n-gramとその出現頻度をまとめた 大規模言語リソースです。統計翻訳、統計的言語モデル、音声認識等への応用が期待できます。 1.1 対象Webページ n-gramは一般に公開されているWebページでGoogleがクロールしたものから抽出されています。 ただし、閲覧に特別な権限が必要なページや一般に公開されていないページ、 metaタグにnorachive, noindex 等が指定されているページは対象に入っておりません。 原則として日本語のテキストを対象にしていますが、他の言語が混入している場合もあります。 以下、対象Webページ集合を単に「コーパス」と呼ぶ事があります。 1.2 対象We