2014年12月5日のブックマーク (3件)

  • 鈍足ランナーのIT日記 KNP がだめだから、Cabochaにしてみるか。・・・

    IT業界で働くおじさんです でも技術がありません。 でも、金持ちになりたいのでPerlの勉強をはじめました。やるしかない・・・ cygwinからKNPを使いたいが結局make出来ず。諦めてCabochaにしてみるか・・・ CRF++0.53をダウンロードしてきて、インストール ./configure make make install こちらのサイトの情報を下にMakefileを編集してあげる さらに、CRF++のMakefileをいじってあげないとCabochaのインストールの際にlibtoolがらみのリンクエラーが発生する。いじり方はCXXLINKの最後あたりに-no-undefinedをいれてあげるだけ。 cabochaはこちらから0.64を選んだが・・・ ./configure make make install でもって、エラーになり。対処できない・・ libtool: comp

  • Holy (K)night [係り受け解析] cabochaのインストールでエラー [ver6.0-pre4]

    2024年08月 / 07月≪ 12345678910111213141516171819202122232425262728293031≫09月 とある事情で、「かぼちゃ/cabocha」という係り受け解析器をインストールすることになった。 これは形態素解析器:Mecabの作者が作成したものである。 で、ググって探してみるとver0.53くらいの古いものを発見。 この0.53のバージョンでも一応動作はするのですが、UTF-8に対応していないため、日語を入力すると文字化けします。 nkfコマンドなどでいちいち変換すれば使えなくもないのですが、やはり面倒。 なので、UTF-8に対応している最新バージョンの0.60を configure -> make をしてインストールすることにしました。 [依存関係] cabochaには依存しているパッケージが有ります。 ・Mecab ・Juman ・T

  • Python 3でお手軽並列計算 ~concurrent.futures を使った ngram 抽出~ - CAMPHOR- Tech Blog

    この記事は CAMPHOR- Advent Calendar 2014 5日目の記事です。 こんにちは @Shtr28です。自然言語処理の研究とかしてます。 今日は研究してる時に便利だった concurrent.futures モジュールを紹介します。 Future は並列計算のパターンのひとつです。 今回はテキストを使って機械学習するときによく使う ngram を Future で並列計算します! 日語を形態素解析器 mecab で分かち書きして、一行ずつ ngram を計算します。 フルのコードはここ(gist)。 メインの並列化のコードはここ。 def multi_process(): # kgram に対して識別番号を順番にふるための dict kgram2id = defaultdict(lambda: len(kgram2id)) # 並列計算のプロセスプールを確保! wit

    Python 3でお手軽並列計算 ~concurrent.futures を使った ngram 抽出~ - CAMPHOR- Tech Blog