タグ

Pythonとmorphologicalに関するteddy-gのブックマーク (2)

  • Python: Janome で手軽に形態素解析する - CUBE SUGAR CONTAINER

    Janome は Pure Python で実装された日語の形態素解析ライブラリ。 形態素解析というのは文章から意味をもった最小の構成単位となる形態素を取り出すことをいう。 他の日語の形態素解析ライブラリは Python から使えてもバインディングが提供されているだけでドキュメントがイマイチだったり、あるいはインストールが大変だったりということも多々あるんだけど Janome はそんなことがない。 インストール インストールは実に簡単。 pip を使ってさっくりできる。 $ pip install janome 使ってみる 使い方も至ってシンプルで janome.tokenizer.Tokenizer さえ知っていればいい。 Tokenizer#tokenize() メソッドに日語のユニコード文字列を渡すだけで解析ができる。 解析結果はリストで返ってくる。 >>> from jano

    Python: Janome で手軽に形態素解析する - CUBE SUGAR CONTAINER
    teddy-g
    teddy-g 2016/11/28
    Janomeって蛇の目か。確かに簡単に形態素解析できる。便利。
  • 64bit Windows + python 2.7 + MeCab 0.996 な環境をつくる - Qiita

    修正履歴 2016/2/19 コードの修正・必要なファイルの更新 2016/2/19 トラブルシューティングの追加 はじめに そもそもWindowsでなぜ?という話があると思いますが、理由は一つ。Windowsには強力なIDEであるVisual Studioがあるからです。 コード補完、スニペット、デバッグ・・・・多くのメリットがあるIDEですが、いかんせんWindowsでの環境構築には難所が多く、Python関係だとビルドの問題で詰まることが多いようです。 理由は様々ですが、Unixのコマンドが通用しなかったり、ファイルパスの書き方が違ったりといったことがあげられます。 今回は、そんなハードルを乗り越え、自然言語処理屋さん御用達、MeCabのPythonライブラリを入れてみようという話です。 MeCabって? MeCabは、形態素解析ツール。形態素は意味の通る単語の最小ブロックといった感

    64bit Windows + python 2.7 + MeCab 0.996 な環境をつくる - Qiita
    teddy-g
    teddy-g 2016/02/29
    WindowsのPython環境でMeCab使う為のあれやこれや。
  • 1