タグ

researchとimeに関するmoqadaのブックマーク (7)

  • ATOKダイレクトプラグインを連鎖させる(ファイル絶対パス選択プラグイン) - Atzy->getLog()

    とりあえず、プラグインの連鎖とでも呼べるものを作ってみました。 ATOKに限らず、あるファイルの絶対パスを入力したいときにいちいちエクスプローラなどをたどるのがめんどくさいものです。それをしなくてすむようなプラグインが例です。 ソース 例によってソースを書いておきます。大したことはしていません。 #! /usr/bin/ruby -Ku require 'dbm' require 'kconv' DB_FILE = 'filepath_plugin' module Atok_plugin def run_process(request) path = request['composition_string'] path.sub!(/\/[^\/]+\/\.\.$/, "") testpath = path.sub(/^(\w:)$/, "\\1/") if FileTest::direct

    ATOKダイレクトプラグインを連鎖させる(ファイル絶対パス選択プラグイン) - Atzy->getLog()
  • ChaIME

    ブラウザから使える IME としては AjaxIME が有名ですが、AjaxIME よりは仮名漢字変換モデルをがんばっているので、多少精度がよいようです。 ATOK 2007 はたまたま失敗する事例ばかり集めているので悪く見えますが、 普段はもっとよいですね。言語モデルを Web コーパスから作り、仮名漢字 変換モデルを新聞記事から作っているので、上記4つの硬い文は ChaIME でも正しく変換できることは予測可能ですが、下記4つは難しいです。 このような文体で書かれたコーパス(ブログデータ?)から仮名漢字変換モデル を学習するとうまく行くかもしれません。 統計的仮名漢字変換 統計的仮名漢字変換について ページを分けました。 既知の問題点(優先度順) unigram によるバックオフ(辞書引き回数が減る) 仮名漢字モデルの Google語 N グラムからの推定 現在2GBの辞書サイズ

  • API仕様書を公開しました - nokunoの日記

    ちょっと悩んでそのままだったAPIの公開ですが、id:t_daichoさんがATOKプラグインを開発されたのに背中を押されて、仕様書を公開しました。Social IME API仕様書 ver0.01基的にはAPIテスト中 - nokunoの日記の拡張となっています。Social IMEの変換サーバーを使って、かな漢字変換をすることができます。Yahoo! かな漢字変換APIとの違いは、共有辞書による変換ができるところです。 最初に書きましたが、id:t_daichoさんがATOKプラグインとしてSocial IMEを使ったものを作ってくださったようです。ATOKダイレクトAPIが公開されたのでさっそく作ってみた - t_daichoの日記画面にちょっと映ってるけど、Social IMEのサーバーに変換してもらってる。開発者ブログに先々APIを公開するって書いてたけど、今のところブログにち

    moqada
    moqada 2009/07/07
    social ime api 仕様書
  • TokyoCeOH はてな支店!

    2009-08-08 えふwwえふwwえふwww 2009-08-08 おっぷぁい!ぷぁい! 2009-07-24 とりあえず生で!!!!!!! 2009-06-13 yanoshin 2009-05-12 SAKURA

  • SOCIAL IME FOR SQUEAK(4) | squeak.sitej.net

    このような状態を制御するのは面倒なのでFSMを使って制御することとした。FSMはFinite-state machineで、有限個の状態をモデル化したものである。これをイベント駆動で動作を制御するにようにする。C言語などではポインタを使ってイベントに対応する動作を記述する方法や、switch文などに変換したソースプログラムを生成するものがある。今回は上記の状態遷移表ベースに動作制御するようにした。今回上記状態遷移を次のように記述する。 | stateTable fsm | stateTable := #( #(#IME "event" #(#Norm #Rome 'Norm' #method1:) #(#Rome #Norm 'Rome' #method1:) #(#Kanji nil 'Kanji' #method1:) #(#Candi1 #Norm 'Candi1' #meth

  • そろそろChaIMEについて一言いっておくか - 射撃しつつ前転 改

    2月は割とガンガンと開発をしてきたのだが、3月に入ってさすがにエネルギーが切れてきたので、一旦、気分転換にエントリに書いてみることにする。 ChaIMEというのは主に研究目的のかな漢字変換エンジンである。奈良先の小町さん(id:mamoruk)がメインで開発していて、自分もここしばらくはアクティブに開発している。こちらでデモを試すことができる。ChaIMEの特徴はひたすらに統計情報で変換をするところなのだが、今回はそういった話ではなく、もうちょっと一般的なかな漢字変換についての話をダラダラと書いてみようと思う。 デモを見て分かる通り、今までのChaIMEはステートレスで、ひらがな列を入力に対してそれっぽい変換候補を複数出力してさぁ選べ、という形だった。文節境界を変更したり、文節毎に候補を出すことはできない。これは単に実装コストの問題で、研究用途で実験をする際には文節境界を変更してどうたらこ

    そろそろChaIMEについて一言いっておくか - 射撃しつつ前転 改
    moqada
    moqada 2009/03/02
  • Japanese IME

    On / Off : Shift + Space 変換開始 : Space 候補選択 : Space ↑ ↓ 文節移動 : ← →, 確定 : Enter 強制かな : F6, 強制カナ : F7 操作方法 テキストボックス上でローマ字入力をすると日語を入力できます。変換を始めるにはSpaceキーを押してください。 変換中の文字列や変換候補は画面右側に出ます。 文節の移動は候補リスト表示中に左右の矢印キーで行い、候補の選択は上下キーおよびSpaceキーで行います。 変換中のすべての文節を確定するには次の文字列を入力し始めるか、Enterキーを押して下さい。 Shift + SpaceでIMEを有効/無効にできます。 ※ Firefoxで開発・動作確認中です。ほかの環境では不安定であったり、動作しない場合があります。 未実装の機能 学習・ユーザ辞書 文節の切り直し データ取得遅延対策 ��

    moqada
    moqada 2009/02/17
    JavaScriptによる日本語IME実装
  • 1