MALLET is open source software [License]. For research use, please remember to cite MALLET. MALLET is a Java-based package for statistical natural language processing, document classification, clustering, topic modeling, information extraction, and other machine learning applications to text. MALLET includes sophisticated tools for document classification: efficient routines for converting text to
Frustratingly Easy Domain Adaptation, Hal Daume III ACL 2007 to appear(pdf) はドメイン適用問題での現在の最高精度を、perlで10行ぐらい書いて入力データを変換させたら達成できたよという論文。Frustratingly(訳:ストレスのたまるほど) と書いたほど、簡単な方法。 俺も修論の発表で、成果の重要度を、高い順に並べたとき(C++の)ソース量で考えると10行、500行、1万行。そして、発表の流れ上、二つ目、三つ目の内容を捨てざるを終えなかった。その時の気持ち・・ --- 上の論文は名前が面白いだけじゃなく、内容も面白いので簡単な説明 ドメイン適用は実アプリケーションではよく問題になることで、学習器を作ろうとしたとき、ある分野(例えば新聞記事)に関する正解データは大量にあるけど、今から解こうとしている問題(例えば
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く