タグ

KKCとIMEに関するgologo13のブックマーク (23)

  • Smart Common Input Method - Wikipedia

    Smart Common Input Method (SCIM) は30以上の言語(CJKVと多くのヨーロッパ言語)をサポートするPOSIXスタイルのオペレーティングシステム(LinuxやBSD)のためのインプットメソッド (IM) プラットフォーム。 元々はTurbolinuxで "Smart Chinese/Common Input Method platform" として提供されていたものであった[1]。 SCIMはC++で書かれている。インタフェースが可能な限りシンプルで独立したクラスにより抽象化されているので、IMの開発者は少しのコードで独自のIMを作ることができる。

  • かな漢字変換エンジン開発で大事なのはデータと API - 武蔵野日記

    id:tkng さんが、現状の ChaIME について紹介して、これからの開発研究体制について話したい、ということで、京大に集まってミーティング。京大の森さんたちが作っている変換エンジン KAGAMI も9月くらいから格稼働している(少なくとも森さんは常用している)そうで、データやサーバ、ライブラリなど共通化できるところは共通化しましょう、というわけで、総勢5人でお昼から夕(学生さんは free pizza と free beer (笑))を挟んで11時近くまで、スライド使ったりデモしたりコード見たり雑談したり、いろいろ。 今後の方針については、tkng さんがものすごくがんばってくれてメモリ・ディスク使用量、処理時間ともに1/25くらいになって使えるようになってきた(現在 tkng さんと自分の2人が常用している)実用的にしたいと思う反面、実用的にするためにごちゃごちゃした変更を加え

    かな漢字変換エンジン開発で大事なのはデータと API - 武蔵野日記
    gologo13
    gologo13 2010/04/02
    ブックマークした日から約3か月.今ならある程度書いてあることがわかる.問題は学習かぁ
  • Zzz Eee Lll Ccc Hhh

    仮名漢字変換 統計的なモデル(クラス2-gramモデル)を用いる方法を1998年に世界で初めて(!?)提案しました。 当時は、開発者が一生懸命手で書いた規則を用いる方法が主流でした。 確率的手法は理論的なので、保守が容易であったり発展性が格段に高いのが利点です。 実際、分野適応が容易であったり、単語の自動獲得などに発展させることができます。 モデルやコードを簡素化した統計的仮名漢字変換が、以下の SIMPLE リンクからダウンロードで きます。 詳細の解説はいずれ書きますが、とりあえずよい解説に譲ります。 リンク SIMPLE (Statistical Input Method for Personal Learning and Education; 仮) or KyKC (休憩しぃ)? simple.tar ダウンロード (とりあえず再配布不可です) 統計的仮名漢字変換の学習用 単語と読