目次 概要/特徴 リリースノート インストール/使い方 jarファイル 解析用辞書作成 形態素解析 コマンド BuildDic Igo Java API Tagger Morpheme サンプルコード MeCabとの相違点 解析結果 機能 辞書ファイル 単語エントリフォーマット 制限/注意点 禁則文字 バイナリ辞書エンディアン ライセンス バグ報告など 概要/特徴 Javaで実装された形態素解析器。→ Common Lisp版 辞書フォーマット及び解析結果は、ほぼMeCab互換。 単機能。 Javaの形態素解析器としては比較的高速。 スレッドセーフ。 リリースノート version 0.4.3: 2011年06月17日 形態素解析部の微細なパフォーマンスチューニング インストール/使い方 1) jarファイルの取得/作成 jarファイルは以下のいずれかの方法で取得/作成する。 ダウンロード
日本語は英語と違い、単語同士が明確に区切られていないので、一つ一つの単語の品詞を調べる場合は、いわゆる「分かち書き」をする必要があります。 分かち書きとは次のように単語を分けて書くことです。 これは日本語です → これ | は | 日本語 | です プログラミングで分かち書きを行うには大変な労力がかかるので、ゼロから開発するのは現実的ではありません。 簡単に行う方法の一つは Yahoo! API を利用することです。 クエリを送るだけで簡単に解析結果を受け取ることができるので便利ですが、リクエスト回数に上限があったり、クレジット表記が義務付けられたりするので、状況によっては使いにくくなります。 もう一つはサーバーに MeCab をインストールする方法です。 Mecab はオープンソースの形態素解析エンジンで、様々な分野で活用されている実績あるプログラムです。 可能ならこちらを導入するのがベ
今回も igo-php を用いた形態素解析のサンプルなので、導入については こちら を御覧ください。 通常分かち書きをする場合、名詞は細かく分割され、次のように解釈されます。 「これは形態素解析の実験結果です。」 → 「これ | は | 形態素 | 解析 | の | 実験 | 結果 | です | 。」 もちろん間違ってはいないのですが、感覚的には「形態素解析」「実験結果」はそれぞれひとつの単語でまとめられていたほうが自然です。 「東京特許許可局」などの場合も同様に一つの単語として扱うことがほとんどです。 法則を見てみると、名詞が連続している場合は複合名詞になるというシンプルなものなので、 それを踏まえて次のようにしてみました。 <?php require_once 'lib/Igo.php'; $igo = new Igo(dirname(__FILE__) . "/ipadic", "U
pingは、ネットワーク疎通を確認したいホストに対してIPパケットを発行し、そのパケットが正しく届いて返答が行われるかを確認するためのコマンドだ。この確認にはICMP(ICMPv6)またはUDPを用い、さまざまなエラーに応じたステータスを把握することも可能 目的と用途 pingは、ネットワーク疎通を確認したいホストに対してIPパケットを発行し、そのパケットが正しく届いて返答が行われるかを確認するためのコマンドだ。この確認にはICMP(ICMPv6)またはUDPを用い、さまざまなエラーに応じたステータスを把握することも可能。 pingコマンドが正常に実行できれば、通常はホスト間のネットワークは正常であると判断される。また統計値を表示することで、基本的なネットワーク性能を簡易に計測することもできる。 エラーが発生した場合には、何らかのネットワーク障害が発生していると考えられる。ただし、ping
Day by Day Infinity – Webな日々(HTML/XHTML/CSS/JavaScript/PHP/CMS) PHPで、ある関数が存在するかどうかを調べるためにはfunction_exists関数を使います。しかし、この関数ではメソッドの存在は調べることはできません。メソッドが存在するかどうかを調べるにはmethod_exists関数を使います。 文字列からその関数やメソッドが存在するか調べたいと思ったのですが、関数とメソッドを同じように調べたいという場合には、function_exists関数とmethod_exists関数を上手く使い分ける必要があります。PHPにありがちな、やりたいことは似ているけど関数は別々というやつですね 😡 function_exits関数の使い方は、引数に文字列で関数名を渡すだけです。 if (function_exists('func')
教材:日経Linux 2008/5連載 実践!Webサーバー構築 初めてのApacheモジュール 『まず、Apacheにどんなモジュールが組み込まれているか、見てみましょう』『・・・「httpd」コマンドを「-M」オプション付きで実行してみます』とあるので会社で使っているWebサーバーで実行してみる。 # cd /usr/local/apache2/bin/ # ./httpd -M httpd: illegal option -- M Usage: ./httpd [-D name] [-d directory] [-f file] [-C "directive"] [-c "directive"] [-k start|restart|graceful|stop] [-v] [-V] [-h] [-l] [-L] [-t] [-S] Options: -D name : define a
lddコマンドでダイナミックリンクされているライブラリを調べる コマンドやアプリケーションが、どんなライブラリをダイナミックリンクしているのか調べるには ldd コマンドを利用します。 ■ 実行例 # ldd /usr/local/apache2/bin/httpd libaprutil-0.so.0 => /usr/local/apache2/lib/libaprutil-0.so.0 libexpat.so.0 => /usr/local/apache2/lib/libexpat.so.0 libapr-0.so.0 => /usr/local/apache2/lib/libapr-0.so.0 libsendfile.so.1 => /usr/lib/libsendfile.so.1 librt.so.1 => /usr/lib/librt.so.1 libm.so.1 => /us
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く