タグ

2011年8月19日のブックマーク (1件)

  • chasen.py - 備忘録-研究や勉強のメモ-

    入門自然言語処理12章を読み進める。 p.473 にて ChasenCorpusReaderを使って形態素解析済みの日語コーパスを読み込む部分で少し詰まる。 まずchasen.pyをダウンロード(というかソースをコピペでemacsに貼り付け保存) さてこれをライブラリのどこに置いておけ良いのだろうか。。ソースの中ではimport utilとimportしているものもあるし。。試行錯誤して場所をあれこれ変えて試す。そして「C:\Python26\Lib\site-packages\nltk\corpus\reader」でおそらく正解だと決定。CorpusReaderのutilは共通のものをimportするってことなんでしょう。 ちなみにchasen.pyをインポートするときは from nltk.corpus.reader.chasen import * とせねばならず、の表記 from

    chasen.py - 備忘録-研究や勉強のメモ-