MS-IME 2007 に遅れること 1 年,ATOK も統計的言語処理へ.これでだいたい役者は揃った感じですかね. ATOKは従来、最も長く取れる2文節を優先的に選択する「n文節最長一致法」を採用していたが、近年この手法による誤変換の発生が稀ではなくなってきた。そこで、出現頻度や言語的性質などを数学理論によって1つの評価軸の上に積算する統計的言語処理手法を採り入れた。また、機械処理に頼らず、人手による検証と微調整を重ねることで、体感的な変換精度を向上させたという。具体的にはATOK 2007と2008で下記のような差が出る。 2007:請求書の/市は/来日時/ 2008:請求書の/支払い/日時/ 2007:景気/回復の/広がりに/花岡/代を/残している。/ 2008:景気/回復の/広がりには/なお/課題を/残している。/ 2007:去年に/比べた/海水/順だ/ 2008:去年に/比べ/高