[B! 日本語] a2ikmのブックマーク

a2ikm id:a2ikm

日本語に関するa2ikmのブックマーク (6)

Ajax を使った日本語 IME + KWIC
IME と KWICの合わせ技です. 杉田玄白プロジェクトの日本語文書を検索します. IMEで複数候補出力し, 検索しています. まるで migemo です. ただし, かな漢字変換をしているため文節(単語境界)をまたぐ場合も動作します. 検索はすべてバックエンドで行われるので, 大量テキストの検索に向いていると思います. クエリ
a2ikm 2008/07/01
migemo

ajax

日本語

japanese
リンク
X11 for Mac OS Xでことえりを使う
X11 for Mac OS Xでことえりを使えるように、TSMのドキュメントやkinput2、jmodeのソースを覗きながら、XIMサーバを仕立てようなどとコード片を書き始めてみたが、先がかなり長そうなのであらためてGoogleで検索。九州大学の園田氏が作成され、MachTenのX11でMacのIMを使えるようにするというkinput2.MacIMを発見。方針を大幅に変えて…、kinput2.MacIMを改造してX11 for Mac OS Xでことえりを使うようにするパッチを作成してみた。 kinput2.MacIMはhttp://homepage1.nifty.com/daemon/MachTen/sonoda/で公開されている。システム条件: Mac OS X 10.4 (Tiger)、10.3 (Panther) XcodeとX11 SDKのインストールも必要。
a2ikm 2008/06/19
mac

osx

日本語

x11

macuim

software

kotoeri
リンク
https://osksn2.hep.sci.osaka-u.ac.jp/~taku/osx/perl/perl_utf.html
a2ikm 2008/05/14
perl

utf8

unicode

日本語

encoding

charset
リンク
Universalchardet - やる気向上作戦
universalchardet / juniversalchardet Mozillaのエンコーディング判別ライブラリであるuniversalchardetを切り出して、Cライブラリ化してみた。さらにJavaにもポーティングしてみた。エンコーディング判別なのにcharacter set detectorとはこれいかに。 C版はLinux/Windowsに対応。Linuxでのインストールは make && make install で。autoconfなどという高尚なものは使っておりません。文字コードの変換はこちら EncodingConversion Related Works jchardet (Java,旧バージョンのchardet) juniversalchardet（Java,universalchardetのJavaポート） Universal Encoding Dete
a2ikm 2008/05/11
library

mozilla

文字コード

programming

charset

日本語

encoding

c
リンク
http://lxr.mozilla.org/seamonkey/source/extensions/universalchardet/src/base/
a2ikm 2008/05/07
mozilla

日本語
リンク
Kazuho@Cybozu Labs: キーワード抽出モジュールを作ってみた
« IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日キーワード抽出モジュールを作ってみた一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパラメータのチューニングを行ったところ、十分な品質が出そうなので、書き直して公開することにしました。普通の Perl モジュールなので、 perl Makefile.PL && make && make install すれば使うことができます (15:50追記: すみません。 MeCab
a2ikm 2008/04/16
自然言語処理

形態素解析

日本語

キーワード抽出

programming

perl

mecab
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx