タグ

imeに関するyuisekiのブックマーク (5)

  • Mozc(Google日本語入力)のコードを読んだメモ - 射撃しつつ前転 改

    Google日本語入力がOSS化されたということで、気になっていたところをいくつか確認してみた。 変換アルゴリズムはどんな感じか? twitterの工藤さんの発言にも「わりと古典的な最小コスト法」とあるけれど、まさにそんな感じ。人名の処理とかでちょっと特別なコードが入ったりもしているが、ほぼ基的な統計的かな漢字変換のモデル。係り受けの情報とかは使っていない。Viterbiでベストパスを求めて、品詞ベースで文節にまとめあげている。コストモデルは接続コストが品詞対品詞で、単語コストの方は単語毎に設定されているっぽい。 src/converter/immutable_converter.ccのImmutableConverterImpl::ViterbiがViterbiアルゴリズムの部分で、その後にMakeSegmentsで文節にまとめている。読むならImmutableConverterImp

    Mozc(Google日本語入力)のコードを読んだメモ - 射撃しつつ前転 改
  • Wnn - Wikipedia

    Wnn(うんぬ、ウーンヌ)は、日語のかな漢字変換による日本語入力システムの一つである。元来はワークステーション向けに開発され、後に組込機器向けが主要な用途となった。 1985年から京都大学、慶應義塾大学、立石電機(現・オムロン)、アステック(現・アールワークス)によって共同開発され、1987年に完成した[1]。 開発当時は、PCでは連文節変換がすでに実現されていたが、ワークステーションでの日本語入力システムは一般的に、単語ごとまたは文節ごとに変換していた。このシステムは、ワークステーションでも「Watashino Namaeha Nakanodesu」と入力して正しく「私の名前は中野です」と一括変換できるような連文節変換を実現することを目指して開発されたことから、その文字列の頭文字を取ってWnnという名前が付けられた。「中野」は日語処理開発チームの立石電機側の窓口となっていた人の名前で

  • 日本語入力について - アスペ日記

    私が日本語入力について思っていることを書いてみる。 自分としては、デフォルト以外の日本語入力システムとして、ATOKGoogle 日本語入力ぐらい(まあ、Baidu IME とかもあるが)しかないのが心の底から残念でたまらない。 雑誌の特集などで、Google 日本語入力ATOK に単語や文章を変換させて精度を比較しているものを見かける。まあ総合的には同じぐらいの結果になっている。だが、実際に長い間使っているとわかるのだが、Google 日本語入力の間違え方のほうが「理不尽」なのだ。どうしてこれがこうなる? と思わず言いたくなるような。その点、ATOK は弱い部分が前もってわかる。アニメやゲームなど、マニアックな変換には弱い。しかし、ATOK である程度日語の文章を打ち慣れた人にとっては、そういう「難しいだろうな」と思うようなところは、打つ前からそのことがわかるものだ。 ATO

    日本語入力について - アスペ日記
  • GitHub - masui/Gyaim: MacRuby-based simple IME for Mac

    Gyaim MacRubyで作ったMac用のIMEです。 数百行のRubyで実用レベルのIMEを作れることを示すものです 単純な変換しかできませんがそれなりに使えます 見栄えはInterfaceBuilderで簡単に変更できます 変換アルゴリズムやIMEの動作はRubyで簡単に変更できます 自前のIMEをいろいろ作りましょう! 変換手法はSlimeと同じです 予測機能はありません インストール MacRubyのインストールが必要です 多分SnowLeopardが必要です XCode3でビルドします make でビルドできます その後、ログアウトして再ログインすると 「言語環境設定」からGyaimを選択できるようになります 辞書はSlimeのものを使っています 使いかた ローマ字を入力すると候補が表示されます スペースキーで候補を選択し、改行キーで確定します ローマ字入力の後ですぐ改行キーを

    GitHub - masui/Gyaim: MacRuby-based simple IME for Mac
    yuiseki
    yuiseki 2011/04/05
  • Google 日本語入力 - CGI API デベロッパーガイド

    Google CGI API for Japanese Input Google CGI API for Japanese Input は、日語変換をインターネット上で実現するための、CGI サービスです。 リクエスト http://www.google.com/transliterate に対して HTTP リクエストを発行します。GET メソッドを使ってください。以下の CGI パラメータを (URL エンコードした上で) 指定します。 langpair=ja-Hira|ja text=(変換したいひらがな列) text のひらがな列は UTF-8 でエンコードします。例えば、「へんかん」をリクエストする場合は、 http://www.google.com/transliterate?langpair=ja-Hira|ja&text=%E3%81%B8%E3%82%93%E3%81

  • 1