タグ

mecabに関するokinakaのブックマーク (3)

  • mecab-ipadic-neologdがすごいという話 - kivantium活動日記

    [O] MeCab 用の新語辞書 mecab-ipadic-neologd を公開しましたという記事が話題になっていたのでmecab-ipadic-neologdを試してみました。 インストール READMEを見れば分かりますが一応メモ sudo apt-get install mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git cd mecab-ipadic-neologd ./bin/install-mecab-ipadic-neologdでインストールできます。 インストール先は echo `mecab-config --dicdir`"/mecab-ipadic-neolo

    mecab-ipadic-neologdがすごいという話 - kivantium活動日記
  • [小ネタ] mecab + unidic で出力フォーマットを整形する方法

    編集長の佐藤(http://cocky.exblog.jp/)です。 最近当ブログも投稿が少ないのでちょっと小ネタをひとつ。 形態素解析といえばおなじみmecabですが、最近は標準のIPADICではなく、代わりにUniDicを使うケースがちょっとずつ出てきてます。特にVer.2.0.1以降はGPL/LGPL/BSDのトリプルライセンス化されたことでライセンス上の問題がなくなったので、その点でも使いやすくなりました。 ただmecabでUniDicを使うと、なぜか標準だと「–node-format」などの出力整形が効きません。しかもUniDicの場合、吊るしの状態で使うと「-Oyomi」などの出力フォーマット指定もできません(UniDicのdicrcに書いてないので当たり前ですが)。 でもIPADICと比べると、UniDicの方が辞書の収録語数などが圧倒的に多いので、どうしても「mecab +

    [小ネタ] mecab + unidic で出力フォーマットを整形する方法
  • ウノウラボ Unoh Labs: PHPとMecabでキーワード自動リンクを実装する

    こんにちは、山下です。 今年もどうぞよろしくお願い致します。 Webサービスを開発していると、特定のキーワードを自動でURLリンクにする処理が必要になることがあると思います。今回は、このキーワード自動リンク機能を形態素解析ツールMecabを使ってPHPで実装する方法を紹介したいと思います。 説明に入る前に少し補足しておくと、Trieの実装であるDouble-Array処理だけ利用したいのであれば、MecabからDouble-Array処理の部分を切り出したDartsというライブラリがあります。しかし、なぜMecabを使うかというと、PerlだとDartsのバインディングが公開されているのですが、現時点でPHP版はありません。また、最近のLinuxディストリビューションでは、Mecabのパッケージが最初から用意されているため、より簡単に利用できると思ったからです。 それでは、順を追って説明

  • 1