この記事は abicky.net の MeCab ソースコードリーディング私的メモ(形態素解析編) に移行しました
こんにちは。研究室合宿の準備に追われてる人です。 今回は環境構築の延長で、日本語の形態素解析を行ってくれる mecab及びmecab-pythonの導入について書きます。 簡単にmecabの機能を紹介すると、 「すももももももものうち」という文章をmecabにかけると baito1024:python baito1024$ mecab すももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ EOS 以上のように分けてくれるものです。 自然言語処理においては単語ごとにスペース区切りされていると データとして扱い易
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く