メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
![Google Japan Blog: 大規模日本語 n-gram データの公開](https://cdn-ak-scissors.b.st-hatena.com/image/square/344988ebe8c10ce169549d8d7d0d0862cd8c4b1d/height=288;version=1;width=512/https%3A%2F%2F2.bp.blogspot.com%2F-7bZ5EziliZQ%2FVynIS9F7OAI%2FAAAAAAAASQ0%2FBJFntXCAntstZe6hQuo5KTrhi5Dyz9yHgCK4B%2Fs1600%2Fgooglelogo_color_200x200.png)
メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
社団法人 電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 TECHNICAL REPORT OF IEICE. 類似性に基づいたウェブページ選択インタフェース 松本 裕二† 馬野 元秀† 瀬田 和久† † 大阪府立大学 大学院 理学系研究科 情報数理科学専攻 〒 599–8531 堺市学園町 1–1 E-mail: †matumoto@marron.cias.osakafu-u.ac.jp あらまし インターネットの検索エンジンが返すページは膨大で重複が多い.普通はキーワードを追加して検索を絞 り込むが,適切な検索質問を作成するのは難しい.そこで,我々はユーザが指定した項目 (ページ) との類似性に基づ いて,検索結果の各項目 (ページ) を一覧から削除したり残したりす
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基本中の基本ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く