タグ

形態素解析に関するottonoveのブックマーク (2)

  • Fessを形態素解析サーバーとして利用する | 今日のひとこと

    まぁ、Fessというか、Solrの機能ですが、Solrはインデックスを作るときに文書を単語に分割します。その単語分割はインデックスを作成する以外でも呼び出すことはできるので、その紹介です。利用用途としては何かしらの文書を単語に分割すれば、名詞だけピックアップしてその文書にタグとしてつけたりとか、考えれば何かいろいろと出てくるでしょう(たぶん…)。そんな感じで、形態素解析APIで手っ取り早く利用したい場合には、Fessを利用すればあっという間に利用できます。 利用方法はFessをインストールします。手順は簡単なのでJavaがインストールされていれば、5分もかからないでしょう。そして、Fessを起動したら、たとえば、curlコマンドとかで $ curl --basic --user solradmin:solradmin "http://localhost:8080/solr/core1/a

  • 日本語形態素解析の初歩

    社内で LT をする機会があったので、最近趣味で MeCab のソースコードを読んでいることもあって日形態素解析について初歩的な説明をしてみました。 今まで系列ラベリングとか勉強したことがあるくせに、日語みたいに分かち書きされてない言語の形態素解析がどう行われているかよくわかっていませんでした・・・。 形態素解析の解説資料は色々目を通したことがあったんですが、単語分割と品詞タグ付けを合わせて系列ラベリングの問題として扱っていると思い込んでいたので「????」な状態でした。思い込みって怖いですね。 ちなみに、スライド内でチラッと言及しているダブル配列については次のエントリーが素晴らしくわかりやすいです。 情報系修士にもわかるダブル配列 - アスペ日記

    日本語形態素解析の初歩
  • 1