
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
IPA品詞体系で分類できない日本語5選
形態素解析機を使っていると色んな場面で「あれ、解析うまくいってないな……?😓」という場面に出会いま... 形態素解析機を使っていると色んな場面で「あれ、解析うまくいってないな……?😓」という場面に出会います。 単に辞書に無いだけの単語というのはいくらでもありますが、中にはさらに根本的な理由で解析ができない単語というのも存在しています。 MeCabなどで多く用いられているIPADICにはIPA品詞体系という体系が用いられています。この品詞体系は非常に包括的で面白いのですが、よく見ると所々欠けている品詞があったりします。そうした欠落のために、一部の言葉が品詞体系上原理的に「解析・分類できない日本語」となっているのです。 この記事では「そこそこ一般的に用いられるにもかかわらず」「品詞体系上分類することが困難である」ような日本語[1]の例を挙げ、なぜ解析できないのかを解説してみます。 品詞体系全体の解説もあります。ぜひご覧ください。 本記事ではIPADICのバージョンは2.7とします。 1.「いらっ
2024/05/22 リンク