ブックマーク / zenn.dev/azookey (1)

  • IPA品詞体系で分類できない日本語5選

    形態素解析機を使っていると色んな場面で「あれ、解析うまくいってないな……?😓」という場面に出会います。 単に辞書に無いだけの単語というのはいくらでもありますが、中にはさらに根的な理由で解析ができない単語というのも存在しています。 MeCabなどで多く用いられているIPADICにはIPA品詞体系という体系が用いられています。この品詞体系は非常に包括的で面白いのですが、よく見ると所々欠けている品詞があったりします。そうした欠落のために、一部の言葉が品詞体系上原理的に「解析・分類できない日語」となっているのです。 この記事では「そこそこ一般的に用いられるにもかかわらず」「品詞体系上分類することが困難である」ような日語[1]の例を挙げ、なぜ解析できないのかを解説してみます。 品詞体系全体の解説もあります。ぜひご覧ください。 記事ではIPADICのバージョンは2.7とします。 1.「いらっ

    IPA品詞体系で分類できない日本語5選
    mominis
    mominis 2021/04/09
  • 1