タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Pythonとjumanに関するmfks17のブックマーク (2)

  • Pythonで JUMAN++ を使用する方法 - 望月いちろうの雑記帳

    2016 - 10 - 20 Pythonで JUMAN++ を使用する方法 Python 形態素処理 list Tweet Share on Tumblr JUMAN++の Python ラッパー 京大で開発されたRNNベースの 形態素 処理エンジンのJUMAN++は C++ で書かれていますが公式が Python ラッパーを提供しています。 Linux でのみ利用可能とのことですが今回は Mac での動作確認を兼ねて OSX で実行してみることします。 最初にJUMAN++がインストールされているか確認して下さい もしインストールされていない場合はこちらを参考に mochizuki4.hatenablog.com まずは公式にしたがってライブラリをインストール $ wget http://nlp.ist.i.kyoto-u.ac.jp/nl-resource/knp/pyknp-0.3

    Pythonで JUMAN++ を使用する方法 - 望月いちろうの雑記帳
  • mecab, cabocha, juman, knpの処理速度とか - Into the Horizon

    knpを初めて使ってみたら結構処理が遅かったので、どれくらい速度に差があるのか検証してみました。 速度のオーダーを確かめてみる程度の検証です(真面目な検証ではない) ■実験設定 pythonからsubprocessを使って*1各ツールを呼び出し ウェブコーパスからn文を解析して、1文辺りの時間を計測、ツール間で比較しました KNPは解析速度が文字数により指数的に低下するようなので、KNPについては文字数を変えて実験してみました。(mecab, cabochaはそこまで文字数に依存しない) 日語の1文は、だいたい30~40文字くらいの目安感です(きっちりした文章だともうちょい長い) 40文字ってどれくらいかと言うと 「特に上流部なんかは補充が効かないところが多く、一度やられると少し時間がかかります」 これできっちり40文字。 ■実験結果 解析器 入力文数 1文の文字数 実行時間 1文辺りの

    mecab, cabocha, juman, knpの処理速度とか - Into the Horizon
  • 1