タグ

mecabに関するhsaitouのブックマーク (3)

  • PythonでMecabを使うための準備 - otukutunの日記

    Mac上でPythonを使って、Mecabを操作したいと思い、インストールしました。そしたら、思った以上に詰まったので、メモ。 MecabとIPA辞書のインストール Homebrewを使って、インストール $ brew install mecab $ brew install mecab-ipadic これで、Mecabは使えるようになります。 $ mecab 明日は走ろうと思う。 明日 名詞,副詞可能,*,*,*,*,明日,アシタ,アシタ はう 動詞,自立,*,*,五段・ワ行促音便,基形,はう,ハウ,ハウ と 助詞,格助詞,引用,*,*,*,と,ト,ト 思う 動詞,自立,*,*,五段・ワ行促音便,基形,思う,オモウ,オモウ 。 記号,句点,*,*,*,*,。,。,。 EOS 次に、Python上からMecabを操作するために、Pythonのバインディングをインストールします。 Pyt

    PythonでMecabを使うための準備 - otukutunの日記
  • Mecab Pythonを使ったTF・IDFによるWikipediaの重要単語抽出 - Y's note

    入門 自然言語処理 作者: Steven Bird,Ewan Klein,Edward Loper,萩原正人,中山敬広,水野貴明出版社/メーカー: オライリージャパン発売日: 2010/11/11メディア: 大型購入: 20人 クリック: 639回この商品を含むブログ (44件) を見る TF・IDF計算 自然言語処理の勉強としてTF・IDFによる重要単語の抽出をwikipediaのデータに対して試してみます。TF・IDFを一言でまとめると、とある単語の重要度を出現頻度から計算する手法です。計算結果は重みを表します。TFは単語の出現数(Term Frequency)、IDFは総文書数 / 単語が出現する文書の総数の対数(Inverted Document Frequency)、TFIDFはその積になります。数式にすると以下のようになりますが、Webを検索してみると人によって計算の仕方が異

    Mecab Pythonを使ったTF・IDFによるWikipediaの重要単語抽出 - Y's note
  • MacPortsでMeCabを入れてPythonバインディングをvirtualenv環境に入れた - kanonji’s diary

    最近読んでるオライリーの入門ソーシャルデータを読み進めるのに必要みたいだったので、MeCabを入れました。入れるのはMacPortsで簡単だったけど、ちょっとだけ注意点があったのでメモしておきます。 インストール $ sudo port install mecab $ sudo port install mecab-ipadic-utf8 $ cd /opt/local/lib/mecab/dic/ $ sudo ln -snf ipadic-utf8 sysdic $ mecab これはテストです。 #標準入力 これ 名詞,代名詞,一般,*,*,*,これ,コレ,コレ は 助詞,係助詞,*,*,*,*,は,ハ,ワ テスト 名詞,サ変接続,*,*,*,*,テスト,テスト,テスト です 助動詞,*,*,*,特殊・デス,基形,です,デス,デス 。 記号,句点,*,*,*,*,。,。,。 EOS

    MacPortsでMeCabを入れてPythonバインディングをvirtualenv環境に入れた - kanonji’s diary
  • 1