そろそろChaIMEについて一言いっておくか を書いてからもう半年以上になる。あれから日記には何も書いていなかったが、開発の方は地道に進めている。最近、自宅で使うかな漢字変換エンジンはChaIMEに切り替えた。まだまだやらないといけない事はたくさんあるが、とりあえず連文節のかな漢字変換エンジンとして体を成してきたかな、というぐらいのところまでは来たと思う。一応学習機能もついたし。まぁ、これからどうするかは、一旦落ち着いて考えたい。 変換精度については、Google 日本語N-gramが使えないという事で、最初はガタガタだったのだが、地道にデータを集めては形態素解析にかけ、コスト間の係数や未知語コストを調節して、という作業を何回か繰り返し、以前と比べると、だいぶ良くはなってきた。ただ、これは作者の贔屓目的な面が否めない。改善の余地はそこかしこにある。まず目につく問題としては、かな漢字モデルの