toolとNLPに関するmorningriverのブックマーク (2)

  • Bar++ -- a stochastic word segmenter

    Bar++ --確率的単語分割ツール はじめに 確率的単語分割(mozilozy)とは、文字間に分割確率を付与することをいう。これを利用して文中の任意の部分文字列に対して単語らしさを得ることができる。 Bar++ は条件付確率場の周辺確率を用いた確率的単語分割ツールである。 新着情報 2007-09-25 (Tue) barpp.0.4.0-0-win リリース -f wordlist オプションをつけました。単語候補リストを提示します。 また -f wordlist -u とすることにより、ChaSen 辞書にない単語のみを出力するようになります。 2007-09-12 (Fri) barpp.0.2.0-0-win リリース ちゃんとパッケージ化しました。-f error オプションをつけました。 ダウンロード 現在のところ Windows のバイナリのみ配布しています。 barpp-

  • きまぐれ日記: mecab 0.92 公開しました

    mecab 0.92 を公開しました。http://mecab.sourceforge.jp 新しい辞書, mecab-ipadic-2.7.0-20060707 も同時公開しています。 大きな変更点は Perl との決別です。0.91 までは辞書のコンパイルなど一部のコードが Perl で実装されていましたが、今回すべて C++ で再実装してだいぶすっきりしました。 辞書のコンパイルなんかは数秒で終わります。 十分テストしていませんが、windows の素の環境でも CRF を使った学習ができます。 さらに、ライセンスがGPL/LGPL/BSDのトリプルライセンスに変更になりました。 * ライセンスを LGPL から GPL, LGPL, BSDスタイルライセンスの トリプルライセンスに変更 * 辞書コンパイラ等, 一部Perlで実装されていたコードをC++で再実装. Perlへの依存性

  • 1