Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. Mozcソースコード徹底解説 #TokyoTextMining - Presentation Transcript Mozcソースコード徹底解説 #tokyotextmining @nokuno 自己紹介 2 Twitter: @nokuno はてな:id:nokuno 自然言語処理勉強会を主催 PRML/R/Python/Hadoopなど 2002~2006:コミケで同人ゲーム売ってた 2007~2008:未踏でSocial IMEの開発 2009~現在:Web業界勤務 今日
200 Wnn4の変換パラメータの値の変更 Wnn4の変換パラメータの値を変更することで、Wnn4の変換効率をアップさせることも可能である。特に好んで使われているパラメータの値は、1993年当時、Wnn コンソーシアムによって開設されたメーリングリスト上で話し合われた結果を、よしだともこが雑誌記事用にまとめたパラメータの値である。この17種類のパラメータの値は、 2 10 2 45 100 200 5 1 40 -100 200 -100 200 80 200 200 200 である。 Wnn4のサーバ(jserver)を,Muleのたまご経由で使っている場合に、パラメータをこの値に変える方法は、~/.eggrc に以下の行を記述する。 (load "eggrc-wnn") (set-wnn-reverse nil) (set-wnn-param 2 10 2 45 100 200 5 1
Main Content For freedom of character representation The CHISE (CHaracter Information Service Environment) project is an open source research and development project aiming at realizing a next-generation character processing environment that is not restricted by general-purpose coded character sets by directly using various knowledge of characters. We attempt to realize a free and advanced charact
Unknown (NyaRuRu) 2013-10-21 03:22:40 > ・日本語キーボード以外で変換エンジンを使いたい > →ibus-anthyでは設定可能。ibus-mozcでは設定できなさそう。よってibus-mozcの問題 以下の方法でibus-mozc有効時に使用されるキーボードレイアウトを制御できることを確認しました. Plan A. (キーボードレイアウトの変更をIBusに任せる) 1. /desktop/ibus/general/use_system_keyboard_layout が false (デフォルト値) であることを確認する 2. /usr/share/ibus/component/mozc.xml の <layout>default</layout> を好みのレイアウト (e.g. <layout>us</layout>) に書き換える 3. Inpu
Xubuntu を 13.10 へアップデートしたら日本語入力(iBus)がクソになったのでその理由を調べてみました。 Xubuntu を 13.10 へアップデートしたら日本語入力(iBus)がクソ(1.5)になりました。どんなにクソかは iBus 1.5がクソすぎる に譲るとして、私はどうしてそうなったのか (あわよくばどうすれば直るのか) を真夜中に調べてましたのでその成果を記しておこうと思います。 私の場合 Vim でIMEを制御 できないことで問題が根深いことを知りました。調べてみると InputContext というクラスから is_enabled(), enable(), disable() の3つのメソッドが消えていました。これらのメソッドは端的に言うと日本語の状態を取得、有効化、無効化するものです。うんもうIME制御なんてできません。ちなみに その修正が行われたのは約2年
Ubuntu 13.10へのアップデートが、問題なく終わった。問題は、iBusが1.5にアップデートされてしまったことだ。 iBus 1.5は、去年の年末にリリースされた。リリース直後から、IRCでは怨嗟の声が絶えなかったが、今になって、ようやくその意味がわかった。iBus 1.5はひどい。ひどいなんてものじゃない。クソだ。いや、クソですら上品過ぎる。iBusは超超超超超・・・残念ながら、まだiBusを罵るべき言葉が発明されていないが、とにかくその超なにかだ。 UNIX風システムでは、伝統的に、日本語入力は、かな漢字変換を担当するIMEと、IMEと文字入力を受け取るアプリケーションの間の橋渡しをするIMに分離されている。ユーザーから見えるIMの役割としては、IMEの有効無効を切り替えることだ。 筆者はこれまで、IMとしてiBusを、IMEとしてMozcを使っていた。 iBusはIMである。
Anthy, Free Japanese conversion engine Anthyはフリーな日本語入力システムです。Anthyに関する情報は以下のURIから取得可能です。 News 2004年11月27日、uim conferenceが開催されました。詳しくはuim conferenceのおしらせをご覧下さい。 Wiki Anthyの情報を集めたWikiです。どなたでもAnthyに関する情報を自由に書きこむ事ができます。インストール情報や使用方法などについても書いてあるので、まずはWikiを一読する事をお勧めします。 メーリングリスト メーリングリストへの参加や過去ログの参照ができます。 ダウンロード ソースコードなどのダウンロードが可能です。現在のAnthyの安定版は9100hです。
ibus-anthy-1.2.1 が出てますが、更新をサボっていたせいで色々知らない機能が増えてました。 親指シフト関係が充実したようです。また、「逐次変換」というもの見えます(まだ使ってない)。 --------- 【追記】5/4 前にもどこかに書いた気がしますが、新しめの ibus 関係のパッケージは、openSUSE なら OBS のこの人のところから入れられます。ただし、公式パッケージではないので、自己責任で。 ※自分は自前でビルドしてしまったので、使ってないです。 --------- その中で、新たな辞書管理機能についてちょっと書いてみます。 この[拡張辞書]の部分ですね。 これは、一言で言うと、自分が以前、 ・~/.anthy/imported_words_default.d/ について ・個人辞書ツール という記事で書いたようなこと(というか、それ以上のもの)が実装された感じ
2000年5月19日に京都大学を中心に活動しているコンピュータサークルである京大マイコンクラブ内のProject Hekeにて開発が始まる。 その後、IPAの平成13年度未踏ソフトウェア創造事業として採択される[1]。採択期間中の2001年7月に開発版がリリースされ、2001年11月にα版がリリースされた。 採択期間終了後も活発に開発が継続されていたが、2007年10月29日現在では、元開発者による開発は終了されている[2]。その後、長い間メンテナンスされていなかったが、2010年5月より Debian が引き継いだ[3][4]。なお、Anthy のソースコードについては、元開発者である田畑によって保守・管理が継続的に行われてきている[5]。 2021年、Anthy Unicode という開発プロジェクトが有志によって立ち上がることとなった。これはAnthy プロジェクトを引き継ぐ目的で作
ソースコード 4.0.0 2018年8月5日 ユーザー名に'@utf16le'(あるいは'@utf16')か'@utf16be'をつけると入出力で使用する文字コードを指定したものにする。 conf.mk内のOSの指定はunameコマンドで行うようにした。 [ctrl]-tオプションで待ち時間を指定できるようにした。-uオプション削除(-t0で代用する)。 [ctrl]-X,-W削除。-kx追加。-cの文字コードは環境変数LANGを参照する。 Readmeで環境変数が優先されると書いていたが、コマンドライン優先に。 自動変換を使うとクラッシュする。 半角カナの候補が文字化けしていた。 最終的な候補がずれて選択されるときがあった。 WIME_SOCKETがw,x,iで使われていなかった。 -pオプションに0を渡すと無視されていた。 wimeリクエストはminor=2を使用する。 必要なもの W
kinput2 の日本語入力オン・オフキー 前提となる環境 ここでは、かな漢字変換サーバーとして canna を選択する場合のみ を考えます。サーバーとして Wnn や sj3 を用いる場合 については触れません。 キーボードとしては、いわゆる「日本語106キーボード」を用 いる場合にしか通用しないと思われる部分があります。 はじめに kinput2 で日本語入力する場合、日本語モードの ON/OFF を行うキーの設 定は意外とややこしく、カスタマイズに苦労する人もいるようです(例えば、 Control+o は別の機能に使いたいのに、どうしても kinput2 に奪 われてしまってはまる、など)。 ここでは、それらのキーの設定がどのようにして決まっているのかを説明 します。カスタマイズしようとする方の一助となれば幸いです。 kinput2 プロトコルと XIM プロトコル まず、カスタマイ
FreeWnn @ OSDN Webページ(暫定版) こちらはOSDN (旧・SourceForge.jp)で運用しているページです。 (Brief information in English) このページへのリンク先がまだsourceforge.jpの場合は、osdn.jp(例・ freewnn.osdn.jp。MLは 別項 参照)になるように変更してください。freewnn.orgについてはまだ利用 できますのですぐに変更する必要はありません。 [FreeWnnとは] [News] [Download] [メーリングリスト] [開発にご協力を] [リンク] FreeWnnとは クライアント・サーバ型のかな漢字変換システム 日本語・中国語(簡体字・繁体字)・韓国(朝鮮)語の変換に対応 過去にX11のcontribなどで配布されていたWnn4.2を基にしたシステム (オムロンソフトウェア
VJE(ヴイジェイイー)は、バックス(VACS)が開発したかな漢字変換ソフトウェア(日本語入力システム)。VJEの名称は、「VACS Japanese Entry system」の頭文字から取ったものである[1]。 当初より特定のアプリケーションに依存せず、独立した日本語入力プログラムとして開発された。 MS-DOS環境では、当初OSベンダーがMS-DOSに添付した能力の低い日本語入力システムか、アプリケーション内蔵か、一体でしか使用出来ない日本語入力システムが幅をきかせており、アプリケーションを選ばず日本語入力の出来るVJEはパーソナルコンピュータを高度に使用するユーザの強い支持を得た。 当時の文献では、動作が比較的軽い、半角かなからの漢字変換ができ、日英混在する文章を書く時に有利であるなどと評されている[1]。 MS-DOSの時代からWindowsの時代に移行するにあたり、VJEのWi
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く