You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
目次 概要/特徴 リリースノート インストール/使い方 jarファイル 解析用辞書作成 形態素解析 コマンド BuildDic Igo Java API Tagger Morpheme サンプルコード MeCabとの相違点 解析結果 機能 辞書ファイル 単語エントリフォーマット 制限/注意点 禁則文字 バイナリ辞書エンディアン ライセンス バグ報告など 概要/特徴 Javaで実装された形態素解析器。→ Common Lisp版 辞書フォーマット及び解析結果は、ほぼMeCab互換。 単機能。 Javaの形態素解析器としては比較的高速。 スレッドセーフ。 リリースノート version 0.4.3: 2011年06月17日 形態素解析部の微細なパフォーマンスチューニング インストール/使い方 1) jarファイルの取得/作成 jarファイルは以下のいずれかの方法で取得/作成する。 ダウンロード
Javaで形態素解析を行うライブラリはいくつかありますが、初めに本家の純正MeCabをがんばってJNIでJava⇔Cを試しましたが うまくいかなかったので他を試してみることに。 いろいろある中でも私はIgoが使いやすいと思ったのでIgoで説明します。 準備 以下をダウンロード Igoのダウンロードサイトからigo-0.4.5.jar MeCab辞書のダウンロードサイトからmecab-ipadic-2.7.0-20070801.tar.gz そしてmecab-ipadic-2.7.0-20070801.tar.gzを解凍。 これらをC:\igoに置いたと仮定してすすめます。 C:\igo\mecab-ipadic-2.7.0-20070801 C:\igo\igo-0.4.5.jar いきなりですが、Igo用(?)の辞書ファイルを生成します。 コマンドプロンプトで以下をたたく! C:\igo
IgoはJavaで作られた形態素解析エンジンです。 JavaはJVMという閉じた空間で動作する分、Cなどのネイティブアプリと連携する際の安定性や性能がイマイチ。 そのため形態素解析をしたい場合もMeCabを使わずにJava製のものを利用するケースが目立ちます。IgoはJavaで形態素解析をする場合に選択肢の1つとして挙げられます。 @Date 2010/12/18 @Env Igo0.4.2/Fedora14 IgoはMeCabの辞書を利用することができ、ほぼMeCabと同じ解析結果を返すことを意識して作られているそうです(詳細は公式サイト参照)。 Igo - Java形態素解析器 http://igo.sourceforge.jp/ 下記ページによると、実行速度もMeCabと比べてそれほど大きく劣ることはないようです。 Igo : MeCabと形態素解析速度比較 http://d.hat
概要 Javaの比較的新しい形態素解析器、Kuromoji。 lucene-gosenやGomokuのように辞書内包で、jarを落とせばその場で利用でき、Unidicに対応していて、ソースがLuceneのtrunkにコミットされているという、何かと気になる特徴の持ち主。 複数のモードを持っているようで、Searchモードを使うと「日本経済新聞」を「日本 | 経済 | 新聞」のように検索で利用しやすい形にばらして解析してくれたり、Extendedモードを使うと未知語をuni-gramにしてくれたりもするらしい。 今日はそんなKuromojiさんの導入から簡易な使い方までをさらっと追いかけてみた。 導入 まずは下記ページからダウンロード。今回はkuromoji-0.7.5.tar.gzを利用。 Downloads - atilika/kuromoji https://github.com/at
概要 Javaの有名な形態素解析器でありながら、長らく「公式サイトどこ?」な状況だったSenとGoSenですが、最近はlucene-gosenなるGoSenベースのライブラリがちゃんと管理された状態で公開されてるとか。 lucene-gosen http://code.google.com/p/lucene-gosen/ しかもこの子は辞書内包なのでjarを落とすだけで使えて、Lucene用AnalyzerやSolr用Toknizerも付いていて、日本語の検索用インデックスを貼る時に便利な各種フィルタも用意されているという、至れり尽くせりな構成になっているとか。 これは触ってみねばということで、とりあえず簡単な形態素解析、辞書の追加、Luceneでの利用、Solrでの利用を試してみました。 ちなみに上のURLでCommiterのところに名前が出ているKoji SekiguchiさんはSol
コンテンツにスキップ ¶ コンテンツ¶ ご案内 構成員 研究内容 研究業績 ローカル情報 リンク¶ マルチメディア工学専攻 情報科学研究科 工学研究科/工学部 大阪大学
CORBAについて学習したいと思っても、必要なソフトがないと思っていらっしゃる方も多いのではないかと思います。実は、Javaを使ってCORBAオブジェクトを作るのであれば、特別なソフトは必要ありません。JDK(J2SE)だけがあればいいのです。 ここでは、CORBAそのものについての解説は割愛しますが、J2SEに含まれるJava IDLを使って、簡単なCORBAのサンプルを動作させる手順についてご説明していきます(CORBAやJava IDLについての詳しい解説は、ほかの文献やJ2SE付属のドキュメントなどをご覧ください)。 ※ この記事では、Java IDLの仕様はJ2SE 1.4 ベータ版に基づいて解説しています。 ■Java IDL Java IDLとは、CORBAで規定されている、いわゆるInterface Difinition Languageのことだけを指しているのではなく、J
Jettyを組み込みサーバとして使いたくて使い方を調べたのですが 情報が古かったのでソースコードを解析して自分なりに使い方を見つけたのでメモ。 Jettyの最新のバージョンのドキュメント はバージョン7系のやり方のようで バージョン9ではコンパイルエラーになってしまいました。 そこで、バージョン9系ではどうすればいいか調べてドキュメントのコードを修正してみました。 package org.eclipse.jetty.embedded; import org.openqa.jetty.http.HttpContext; import org.openqa.jetty.jetty.Server; import org.openqa.jetty.util.InetAddrPort; public class SimplestServer { public static void main(Str
EclipseでJava版App Engineを始めるための基礎知識:Google App Engineで手軽に試すJavaクラウド(1)(1/4 ページ) Google App Engineがやって来るJa!va!だぁ! 米グーグルは2008年4月7日、Pythonで作成したプログラムが動くクラウド・コンピューティング環境「Google App Engine」(以下、GAE)を発表しました。それからちょうど1年後の2009年4月7日、GAEはPythonに加えてJavaへの対応(以下、GAEj)を発表しました(参考:グーグルのクラウドがJava対応、JRubyも稼働か)。 2008年のGAE発表当初、日本ではPythonのプログラマ数があまり多くなく、反響もいまひとつの感じがありましたが、今年になって開発者や利用実績が多いJavaに対応したことで、GAEのユーザー数が一気に増加する可能性
Google App Engineが、Javaにも対応したというニュースを帰りの電車の中で見ました。 Google App Engine Blog: Seriously this time, the new language on App Engine: Java™ 上の記事は英語なので何が書かれてるのかよくわかりませんが、Dukeが飛行機に乗ってたので間違いないです。よく見るとGWTの箱も持ってますね。 Getting Started: Java - Google App Engine - Google Code Getting Startを見ながら遊んでみます。 開発環境をダウンロードする Downloads - Google App Engine - Google Codeから開発環境をダウンロードして 適当なフォルダに解凍します。 Eclipseのプラグインもあったのですが、インス
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く