「mecab-ipadic-neologdのご紹介」のまとめ - mecab-ipadic-NEologd は IPADIC を拡張した mecab のシステム辞書 - 新語・固有表現などを読み仮名・原型付きで168万組を再録(異表記な重複エントリ込) - 最低月2回アップデート(初旬・中旬) - Rを使ったテキストマイニングに今後必須Read less
日本語全文検索システムを、ChaSen と MySQL を使って、スコアの管理や形容詞等も検索できるように独自に作ってきましたが、検索エンジンだけでなく、Webサーバアプリケーションとして、Apache Solr や GETASsoc が公開されており興味がありましたが、なかなか手が出ませんでした。しかし、Apache Solr を試す機会がありましたので、構築メモをまとめました。 また、Apache Solr は、jetty で動作する example を、ダウンロードファイル内に設定されていますが、業務で使用する場合 tomcat での稼働が必要になってくると思い、tomcat での構築を行いました、 ■ インストール前提 Apache Solr は、Java で稼働する Webシステムですので、以下のパッケージがインストールされている前提で進めます。 java jdk (jdk-6u
MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧ください メーリングリスト 一般ユーザ向けメーリングリスト 開発者向けメーリングリスト 新着情報 2012-01-27 MeCab 0.993 MeCab::Tagger::formatNode()が正しく動いていなかった問題の修正 スタックの消費を抑えるため、ほとんどのローカル変数(配列)をヒープ上に退避 2012-01-14 MeCab 0.992 ソースコード中のTypoの修正 2012-01-14 MeCab 0.991 空文字列もしくは空白文字列を解析した時に解析エラーとなる問題を修正 ユーザ辞書の作成に失敗する場合がある問題を修正 2011-12-24 MeCab 0.99 MeCab::Model, MeCab::Lattice クラスを追加 マルチスレッド環境でのユーザビリティの向上。複数スレッドが同一
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く