[B! perl][text-mining] nabinnoのブックマーク

nabinno id:nabinno

perlとtext-miningに関するnabinnoのブックマーク (1)

TF・IDF演習資料
文書からの自動的なメタデータの生成例として，TF・IDFを用いた単語出現頻度によるメタデータ生成を行う．本メタデータの応用例として、Web上の全文検索エンジンを次のURLで公開している。http://web.sfc.keio.ac.jp/~kurabaya/cgi-bin/fulltext.cgi 1: 対象文書群の選び方メタデータ付与対象とする文書群を決定する．TF・IDFの性質上，共通のトピックに関する文書群である等，ある程度同質性の高い文書群を選ぶのが望ましい．本稿では英語の対象文書としてProject GutenbergよりA Short History of the United Statesを，日本語の対象文書として青空文庫より「こころ」を選び適用例を示す． 1.1: 対象文書群の準備対象文書群を特定のディレクトリ(フォルダ)に格納する．1つの対象文書に対し，1つのファイル
nabinno 2015/06/19
tf-idf

text-mining

information-retrieval

perl
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx