MeCabで形態素解析器を作りたい場合は以下の二つの言語リソースが必要です。 1. 辞書 (単語と品詞のペアの集合) 2. 入力文と、それに対応する正解出力ペア(正解データ) 現在公開している mecab-ipadic は、ipadicとRWCPコーパスという正解データを使っています。 ここから分かるとおり、少なくともMeCabを使う場合は、コスト値を丹念にチューニング するといった職人芸は要りません。形態素解析への入力文とそれに対応する(理想)出力 があればコスト値を機械学習的なアプローチで構築すること... > このページを見る
最終更新時間:
2007年06月23日02時26分
みんなのブックマーク 人気(0) 新着
-
ふむー
- MeCabの学習機能
- ふむー
- 学習データの作り方
- mecab
- この辺から勉強してみるか。
- きまぐれ日記: Yahoo!の形態素解析をMeCabで無理やり再現してみる : MeCabの学習機能
- 人口無能用ネタ・api japanese mecab nlp tips yahoo yahoo! 全文検索 形態素解析 日本語 機械学習 自然言語 自然言語処理 言語処理
- takuさんの底力.何気に google vs yahoo の様相
- Yahoo!形態素解析サービスで得られた出力をMeCabの学習データに流し込むことで,「それなりに正しく解析できている」と評する辞書ができあがる。さすがに綺麗な連携。ライセンス問題は微妙。
- Namazu
- すばらしー
- 学習機能があるのか
- MeCabの学習機能
- SEED辞書と学習データ(正解データ)にYahoo!の解析結果を使用したMeCabパラメータ推定のサンプル。新語を追加する際に学習データをどうやって準備するかという問題のある特殊な解答でもあるか。
- なんという。








