エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント3件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
MeCab: 未知語処理
未知語処理の定義 $Id: unk.html 167 2009-03-08 10:16:26Z taku-ku $; 概要 未知語処理(辞書に載ってい... 未知語処理の定義 $Id: unk.html 167 2009-03-08 10:16:26Z taku-ku $; 概要 未知語処理(辞書に載っていない単語の形態素解析の処理)についてユーザが再定義できます。 設定ファイル 配布辞書のディレクトリにある char.def と unk.def という2つのファイル を変更します. char.def 未知語処理のルールです. こちらを御覧ください. unk.def 未知語に対する品詞列のテーブルです. こちらを 御覧ください. ケーススタディ 数字の連続を1つの形態素とする 辞書 (*.csv ファイル)から数字のエントリを削除します。 ipadic の場合は、Noun.number.csv の中から、アラビア数字のエントリを消去します。 char.def を修正し、数字の連続が未知語になるようにします。 .. NUMERIC 1 1 0
2009/07/10 リンク