[B! 形態素解析][検索] torutoのブックマーク

toruto id:toruto

形態素解析と検索に関するtorutoのブックマーク (3)

Google Japan Blog: 大規模日本語 n-gram データの公開
メディア関係者向けお問い合わせ先メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
toruto 2007/11/02
google

search

検索

形態素解析

自然言語処理
リンク
社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 TECHNICAL REPORT OF IEICE. 類似性に基づいたウェブページ選択インタフェース松本裕二† 馬野元秀† ��
社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 TECHNICAL REPORT OF IEICE. 類似性に基づいたウェブページ選択インタフェース松本裕二† 馬野元秀† 瀬田和久† † 大阪府立大学大学院理学系研究科情報数理科学専攻〒 599–8531 堺市学園町 1–1 E-mail: †matumoto@marron.cias.osakafu-u.ac.jp あらましインターネットの検索エンジンが返すページは膨大で重複が多い．普通はキーワードを追加して検索を絞り込むが，適切な検索質問を作成するのは難しい．そこで，我々はユーザが指定した項目 (ページ) との類似性に基づいて，検索結果の各項目 (ページ) を一覧から削除したり残したりす
toruto 2007/07/13
論文

検索

形態素解析

自然言語

search
リンク
[を] 形態素解析と検索APIとTF-IDFでキーワード抽出
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。教科書に載っているような基本中の基本ですが、あらためてエッセンスを簡単な例で解説したいと思います。目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽいということでよろしく。） TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード
toruto 2006/11/24
形態素解析

japanese

自然言語

言語処理

検索

api

yahoo

アルゴリズム
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx