タグ

MeCabに関するlabgaのブックマーク (4)

  • ubuntu 11.10 にmecab, mecab-rubyをインストールする - Qiita

    以前セットアップを行った時はapt-getが全てに使えて楽に出来たのですが、apt-get install mecab-ipadicすると package 'mecab-ipadic' has no installation candidate と言われてしまい、困ったので少しうろうろしてしまいました。どうやらmecab-ipadic, mecab-ipadic-utf8の両方が現在利用不可能な状態らしく、自分でインストールする必要があるようです。 序に手順を忘れないようにメモしておきます。 mecabのインストール # mecab自体はapt-get出来る状態だったので、それを利用します。 $ sudo apt-get install mecab $ sudo apt-get install libmecab-dev # ipaの辞書ファイルを落としてきます $ wget http://

    ubuntu 11.10 にmecab, mecab-rubyをインストールする - Qiita
  • Ubuntu + MeCab - 包丁一本さらしに巻いて

    インストール。 $ sudo apt-get install mecab libmecab-dev mecab-ipadicこのままだと辞書がEUCなので文字コードをUTF-8に変換する。 /usr/lib/mecab/mecab-dict-index -d /usr/share/mecab/dic/ipadic -o /var/lib/mecab/dic/ipadic -f euc-jp -t utf-8 -p~$ mecab すもももももももものうち すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ の 助詞,連体化,*,*,*,*,の,ノ,ノ うち 名詞,非自立,副詞可能,*,*,

    Ubuntu + MeCab - 包丁一本さらしに巻いて
  • MeCabをC++から使ってみる | mwSoft

    概要 MeCabのTaggerとかLatticeをC++から直接呼んで形態素解析してみた。 MeCabのコードリーディングをしようかと思ったので、その前に生っぽい感じのコードを書いて感覚を養ってみようという試み。 尚、記事のサンプルコードはエラー処理とか全然してないので注意。 簡易コード まずは極力シンプルなコードで形態素解析を実行してみる。 #include <iostream> #include <mecab.h> int main(int argc, char **argv) { char input[1024] = "ジョニーは戦場へ行った"; MeCab::Tagger *tagger = MeCab::createTagger(""); const char *result = tagger->parse(input); std::cout << result << std:

  • MeCab: Yet Another Part-of-Speech and Morphological Analyzer

    MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧ください メーリングリスト 一般ユーザ向けメーリングリスト 開発者向けメーリングリスト 新着情報 2012-01-27 MeCab 0.993 MeCab::Tagger::formatNode()が正しく動いていなかった問題の修正 スタックの消費を抑えるため、ほとんどのローカル変数(配列)をヒープ上に退避 2012-01-14 MeCab 0.992 ソースコード中のTypoの修正 2012-01-14 MeCab 0.991 空文字列もしくは空白文字列を解析した時に解析エラーとなる問題を修正 ユーザ辞書の作成に失敗する場合がある問題を修正 2011-12-24 MeCab 0.99 MeCab::Model, MeCab::Lattice クラスを追加 マルチスレッド環境でのユーザビリティの向上。複数スレッドが同一

  • 1