[B! TextMining][Machine Learning] ichanのブックマーク

ichan id:ichan

TextMiningとMachine Learningに関するichanのブックマーク (2)

Windows用テキストマイニングツール"termmi"
はじめに "termmi"はWindows上のテキストファイルの専門用語を複数ファイル間で比較するシステムです。Windows専門用語抽出システム"termex"を用いても複数ファイル間の比較は行えますが、重要度の比較が行いにくいなどの問題がありました。テキストマイニング専用に作成した"termmi"を使うことにより複数ファイル間の重要度の数値比較を有意に行えるだけではなく、各文献の共通部分などさまざまな比較結果を求めることができます。機能と使い方１．複数のテキストファイル(Shift-JIS)を入れたフォルダを、termmiのアイコンにドラッグ＆ドロップします。（和文の場合は「専門用語分析（和布舞）」アイコン、英文の場合は「専門用語分析（英文）」アイコンになります）２．termmiの各サブフォルダに処理結果が保存されます。内訳は次のとおりです。（１）outputフォルダ処
ichan 2009/05/20
TextMining

Machine Learning
リンク
大規模データを基にした自然言語処理 - DO++
人工知能基本問題研究会 (SIG-FPAI)でタイトルの題目で一時間ほど話してきました。発表資料 [pptx] [pdf] 話した内容は - 自然言語処理における特徴ベクトルの作り方と、性質 - オンライン学習, Perceptron, Passive Agressive (PA), Confidence Weighted Learning (CW) 確率的勾配降下法 (SGD) - L1正則化, FOLOS - 索引を用いた効率化, 全ての部分文字列を利用した文書分類で、スライドで70枚ぐらい。今までの発表とかぶっていないのはPA CW SGD FOLOSあたりでしょうかオンライン学習、L1正則化の話がメインになっていて、その両方の最終形の確率的勾配降下法 + FOLOSの組み合わせは任意の損失関数に対してL1/L2正則化をかけながらオンライン学習をとても簡単にできるという一昔前
ichan 2009/03/14
Statistics

Machine Learning

TextMining

NLP
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx