指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。
![テキスト解析:日本語形態素解析API - Yahoo!デベロッパーネットワーク](https://cdn-ak-scissors.b.st-hatena.com/image/square/f9777188e29038a48d1a4fda4794f5ffb522ee9a/height=288;version=1;width=512/https%3A%2F%2Fs.yimg.jp%2Fi%2Fdocs%2Fintegrate%2Fimages%2Fcommon%2Fyj_ogp_1212.png)
404 お探しのページは見つかりません GREE Engineering トップへ戻る
長らくお待たせしてすいません mecab-0.90 rc6 を公開します。 http://mecab.sourceforge.jp/ ドキュメントがまだ未完成ですが、今月中には正式リリースを考えております。 バグ、解析結果の不具合などがございましたらご報告いただけると助かります。 0.81 とは根本的に設計自身が違います。主な違いは - ipadic のパラメータを mecab 自身で学習するように変更 mecab-ipadic という辞書パッケージを独自に作成した - 辞書のテキスト/バイナリフォーマットの変更 - ユーザ辞書のサポート - CRF に基づく解析精度の向上 - ユーザ自身による CRF 学習のサポート - コーパス/辞書非依存性の徹底 - ソフト分かち書き - 未知語処理の性能向上 - 未知語処理ルールのユーザ定義 - Perl/Ruby/Java/Python のインタ
UTF8対応のMeCabインストール ChaSenに続いて、UTF8対応のMeCabインストール。 そんなに悩むことはなかったりする。 ついでにSennaに対応させるのpatchもあてた。 ダウンロード # wget http://chasen.org/~taku/software/mecab/src/mecab-0.81.tar.gz # wget http://dev.razil.jp/archive/mecab-0.81.mte.patch # wget http://chasen.naist.jp/stable/ipadic/ipadic-2.5.1.tar.gz 展開して、ipadic-2.5.1.tar.gzをmecabのディレクトリにコピー # tar zxf mecab-0.81.tar.gz # cp ipadic-2.5.1.tar.gz mecab-0.81/dic/
UTF8対応のChaSenインストール UTF-8対応のChaSenのインストールメモ 環境はCentOS 4.1です。 PcWebのYet Another 仕事のツールの「 第45回 日本語形態素解析ツール「ChaSen」」を参考にしました。 Dartsのインストール # wget http://chasen.org/~taku/software/darts/src/darts-0.2.tar.gz # tar zxf darts-0.2.tar.gz # cd darts-0.2 # ./configure --prefix=/usr # make # make install ChaSenのインストール # wget http://chasen.aist-nara.ac.jp/stable/chasen/chasen-2.3.3.tar.gz # tar zxf chasen-2.3
ChaSen 品詞体系 (IPA品詞体系) ChaSen の品詞体系は任意の階層化を許している。 いわゆる形容動詞は名詞の形容動詞語幹として含まれ、 形容詞には含まれない。Juman の指示詞という カテゴリは「連体詞」に含まれている。 判定詞「だ」は助動詞とされている。 Type1 Type2 Type3 Type4 Examples Description
M08a76 <a href="http://lzhmqxxkbruc.com/">lzhmqxxkbruc</a>, [url=http://qzfwkmpbxacr.com/]qzfwkmpbxacr[/url], [link=http://whvmutveiwgq.com/]whvmutveiwgq[/link], http://smnfnuavyega.com/
MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧ください メーリングリスト 一般ユーザ向けメーリングリスト 開発者向けメーリングリスト 新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指定できるようになった 一部のコンパイラで正しくコンパイルできなかった問題の修正 部分解析モードを変更するAPI の追加 (Tagger::set_partial()) ラティスの生成レベルを変更するAPI の追加 (Tagger::set_lattice_level()) 温度パラメータを変更するAPIの追加 (Tagger::set_theta()) 全候補出力モードを変更するAPIの追加 (Tagger::set_all_morphs()) 2007-
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く