« IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日 キーワード抽出モジュールを作ってみた 一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。 竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパ... > このページを見る
最終更新時間:
2006年04月26日15時56分
みんなのブックマーク 人気(0) 新着
- 初期データベースの準備が不要, メンテナンスフリー
- 形態素解析
- キーワードって何なのか?っていうと,世の中の文書全体における単語の分布に比べて,当該文書にそのキーワードの出てくる確率が高いもの,だと思うわけです.だから,skew(偏り)が,大事なんじゃないかと思っているの
- Mecabの辞書の生起コストでIDFを代用できる
- 自然言語処理
- キーワード抽出。生起コスト。
- 難しい。Fwd山田
- キーワード抽出,形態素解析,サイボウズラボの奥一穂さんの作成した形態素解析エンジン
- mecab + perl
- MeCab を使って文章からキーワード抽出
- 注5: (4/27 11:53 追記) threshold (閾値) の初期値は 5 です
- 日本語文章の解析か、いいな
- 日本語特徴抽出
- 面白い
- キーワード抽出技術
- 文中からキーワードを抽出してくれるPerlモジュール。連続語にも強い
- MeCabを使って形態素解析、キーワードを抽出。
- 面白そう。
- 助詞の「の」連結を一段だけ認める扱いを入れるとうちのと同じに
- mecab
このエントリーを含むエントリー(8)
-
[を] キーワード抽出モジュール Lingua-JA-Summarize 18 users
-
darts 0.32 + chasen 2.3.3 のインストールでエラーになる件 :: Drk7jp 3 users
-
[を] キーワード抽出モジュール Lingua-JA-Summarize 7 users
-
naoyaのはてなダイアリー - はてなダイアリーキーワード抽出モジュール 53 users
-
Kazuho@Cybozu Labs: Lingua::JA::Summarize 0.02 10 users
-
カエルチュウイホウ - Lingua::JA::Summarizeの特徴語に重みをつけて文書検索 4 users
-
キーワード抽出モジュール Lingua::JA::Summarize - プログラマになりたい 4 users
-
キーワード抽出モジュール Lingua::JA::Summarize を使うコツ (nakatani @ cybozu l... 76 users







![法人営業戦術007 生命保険営業のキーワードは“RM” [DVD]](http://ecx.images-amazon.com/images/I/5138VPZInxL._SL75_.jpg)
