日本語形態素解析 内山将夫@NICT mutiyama@nict.go.jp 1 日本語形態素解析 • 入力文を形態素に分割し,各種の情報をつけること 例 「今日は良い天気だ.」を茶筌で解析すると以下のよう になる. 今日 キョウ 今日 名詞-副詞可能 は ハ は 助詞-係助詞 良い ヨイ 良い 形容詞-自立 形容詞・ アウオ段 基本形 天気 テンキ 天気 名詞-一般 だ ダ だ 助 動 詞 特 殊・ ダ 基本形 . . . 記号-句点 2 日本語形態素解析の重要性 • 日本語形態素解析は,日本語処理の最初の方のステ ップである. • 機械翻訳においても,入力文は,単語に分割されて いることを仮定している. • Web検索においても,入力質問やWebページは,形 態素解析される. 3 形態素解析の難しさ • 入力文には,区切の曖昧さがある • 入力文には,辞書にない単語がある. 4 問題