タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

形態素解析とジャストシステムに関するItisangoのブックマーク (1)

  • ATOK 2007 VS MS Office IME 2007

    ATOKの方が賢いとか言われてるけど、それってホント? めんどくさいので以下ATOK 2007はATOK、MS Office IME 2007はIMEと表記。 文節区切り間違い 昔から、一発で正解を出す確率というのは両者ともあまり変わらないけれども、ATOKの方は文節区切り間違いが多くて単語間違いは少ない、IMEの方は文節区切り間違いは少ないが単語間違いが多い、という風に言われていたが、それは2007になっても同じようである。 ただ、語彙数はATOKの方がかなり多いらしい。(参考) ATOKの方が文節区切り間違いが多いというのは、変換アルゴリズムの違いに起因していると考えられる。 両者の方式はそれぞれATOKの方が最長文節一致法、IMEの方はコスト最小法がベースである。 最長文節一致法というのは、文節(名詞・動詞等+付属語)の長さが最も長くなる文節区切りが正解となるもので、コスト最小法とい

  • 1