タグ

MeCabに関するmima3のブックマーク (10)

  • NMeCabで形態素解析してみよう - Qiita

    ちょっと形態素解析でもしてみるか と思いたちまして。 今回はC#で書く必要があったので、.NetでMeCabを参照する方法を調べていたら、 MeCabの.Netでの実装したその名もNMeCabってライブラリがあったので早速使ってみました。 NMeCabは、オープンソース形態素解析エンジンMeCabの解析処理部分を、.NETライブラリとして移植したものです。 オリジナル版MeCabと同じ辞書を使用し、同じ解析結果を得ることができます。 純粋なC#言語で作成されており、ラッパーではないため、インストールがシンプルで、高速性と安定性にも優れています。 とのこと。 辞書は同じなので結果はオリジナルとほぼ変わらないと考えて良さそうです。 ダウンロード 上記NMeCabの公式サイトより最新版がダウンロード可能です。 中身を見てみる ダウンロードしたファイルを解凍すると、このような構造のフォルダが現れま

    NMeCabで形態素解析してみよう - Qiita
  • NMeCabをExcelから召喚してみる - Qiita

    NMeCabComを使わない方法。 こんな具合に使えるよという例示にすぎません。 準備 .NET Framework 4.0環境 Excel-DNA一式 ExcelDna.xllは作成するdnaファイル名に合わせてNMeCabTest.xllに変更。 MeCabのインストール libnmecab.dll 呪文 以下をテキストエディタで作成して、上記のxllと同じフォルダに置いておくこと。 <DnaLibrary RuntimeVersion="v4.0" Name="NMeCabTest" Description="Using NMeCab" Language="CS"> <Reference Path="LibNMeCab.dll" /> <![CDATA[ using System; using System.Text; using NMeCab; public class NMeCa

    NMeCabをExcelから召喚してみる - Qiita
  • MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介

    「mecab-ipadic-neologdのご紹介」のまとめ - mecab-ipadic-NEologd は IPADIC を拡張した mecab のシステム辞書 - 新語・固有表現などを読み仮名・原型付きで168万組を再録(異表記な重複エントリ込) - 最低月2回アップデート(初旬・中旬) - Rを使ったテキストマイニングに今後必須Read less

    MeCab の新語・固有表現辞書 mecab-ipadic-NEologd のご紹介
  • MacにR, MeCab, RMeCabをインストール - shikiのWeblog

    ・実行環境 Mac OS X 10.6.7 R-2.13.0 MeCab-0.98 RMeCab_0.95(64bitバイナリー) ・Rのインストール Rのサイトから http://cran.md.tsukuba.ac.jp/ Download and Install RのMacOS XよりR-2.13.0.pkgをダウンロードする ・MeCabのインストール MeCabのサイトからhttp://sourceforge.net/projects/mecab/files/ mecab-0.98.tar.gzと辞書mecab-ipadic2.7.0-20070801.tar.gzをダウンロードする。 ターミナルからインストールを実行する。(ファイルをDownloadsフォルダにダウンロードした場合) # MeCabのインストール $ cd Downloads $ tar zxvf mecab-

    MacにR, MeCab, RMeCabをインストール - shikiのWeblog
    mima3
    mima3 2013/08/11
  • MacにMecabをインストールする (2013.3) - Qiita

    この記事は、zariganitoshさんの記事を基に、実際に私が試した内容をまとめただけのものです。 MeCabとは オープンソースの日語の形態素解析エンジンです。 日語の文章を分析して、名詞を取り出してくれたりするすごいやつです。 MeCabとsaykanaを組み合わせて使えば、漢字混じりの日語を喋らせる事が出来るようになります。 さらに、Node.jsでTwitterライムラインを監視し、更新された内容をMeCabで解析→sayknaで出力させて、日語のツイートを喋らせる事もできます。 前提条件 Mac : 10.8.2 MeCab : 0.996 mecab-0.996.tar.gz IPA 辞書 : 2.7.0 mecab-ipadic-2.7.0-20070801.tar.gz ダウンロード MeCabとIPA辞書を上のリンクからダウンロードして、適当なディレクトリにおき

    MacにMecabをインストールする (2013.3) - Qiita
    mima3
    mima3 2013/08/11
  • 日本語係り受け解析器 CaboCha Ruby 拡張の基本的な使い方とちょっとした応用 - デー

    ari3_botの会話エンジンで使っている自然言語の処理の中から他の方にも有益そうなところだけ書いておこうと思います。 このエンジン自体はアドホックにヒーリスティクスな処理を追加しまくっていて、とても説明しにくいのですが、基的な部分だけ抜き出して……まとめて……解説します。全部実装できるほど詳細な解説はできないので、取っ掛かりになる程度です。 ちなみにCaboChaのAPIはきちんとしたドキュメントがない?ようで、僕はソースコードを自分で読んで得た知識から解説を行っています。また日語文法関する知識もari3_botを作るためだけに得たものであり、あやしいので、あまり信じすぎないようにしてください。 もくじです。 ari3_botの会話エンジンとは CaboChaの基的な使い方 CaboChaで主語と述語っぽいところを抜き出す 述語を活用してみる その他のいろいろなヒント まとめ ar

    日本語係り受け解析器 CaboCha Ruby 拡張の基本的な使い方とちょっとした応用 - デー
  • MeCab&mecab-pythonをインストール その1 - ふゆみけ

    年末にMeCabのVersion 0.99がリリースされてましたねー よりによってリリース日がクリスマスイブってww ほい,てなわけでMeCab体&Pythonバインディングのインストールです. 環境はWin7 64bit 体のインストール http://mecab.sourceforge.net/#download ここからどうぞ. 僕はWindowsユーザーなのでソースからビルドしようとか無謀なことは考えずにバイナリ落としました.仕方ないね Pythonバインディングのインストール こっちはバイナリ配布されてないんで自力でビルドしないといけません. VisualC++ 2008 Express Edition をインストールしていない方は入れておいてください. http://code.google.com/p/mecab/downloads/list ここから mecab-pyth

    MeCab&mecab-pythonをインストール その1 - ふゆみけ
    mima3
    mima3 2013/06/05
  • さくらインターネットスタンダードプランで UTF-8 の MeCab を使う際のメモ

    最近ちーと忙しいもので、ブログの間隔空ちゃってます。サーセン>< あんまりあいだ空けるのもアレなので、今日はさくらインターネットのスタンダード鯖で、MeCab を UTF-8 で使う方法を簡単にご紹介。 まず MeCab は形態素解析のライブラリです。家サイトはこちら。 MeCab: Yet Another Part-of-Speech and Morphological Analyzer さくらインターネットのサーバには元から MeCab がインストールされてますので、単に使うだけならそのままでおkです。ただ EUC-JP 版の辞書がインスコされてますので、そのまま UTF-8 なウェブアプリで使用すると〜問題が発生します。今日ご紹介するのはそれを回避する方法です。 回避方法は簡単で、UTF-8 な辞書ファイルを別にインスコするだけです。以下、具体的なやり方。 辞書のアーカイブをサーバ

    さくらインターネットスタンダードプランで UTF-8 の MeCab を使う際のメモ
    mima3
    mima3 2013/06/03
  • さくらのレンタルサーバでMecabを使用する

    さくらインターネットのレンタルサーバで、Ruby経由でMecabを使おうと思い、いろいろハマりながらインストールした際のログです。 入れたものは ・MeCab0.98 ・mecab-naist-jdic-0.6.1-20090630 ・Ruby-1.9.1-p243 ・mecab-ruby-0.98 以上4ソフトです。 mecab-rubyを入れる為に、わざわざHOMEの下にrubyを入れています。 インストール先は、$HOME/usr/loacalにしています。ここだとNAISTの辞書を入れるのが楽だったからです。 現在(2009/10/11)、さくらのレンタルサーバにはMeCabが既にインストールされているようです。 私の環境は、こんな状態でした。 $ which mecab /usr/local/bin/mecab $ /usr/local/bin/mecab -v mecab of

    mima3
    mima3 2013/06/01
    さくらレンタルサーバーは2013/05時点でgccのバージョンの関係でこの0.98がベストのもよう・・・
  • MeCabの辞書にはてなキーワードを追加するスクリプトを書いた | Skycat's Lair

    アクセス解析見てたら、検索エンジンから404に飛んでた人が結構いたので、 以前(サーバデータ消えるまで)、公開してた記事を復活させるよー。 まずはMeCab関連のこいつから。 すこしずつ戻していきますん。 ・経緯 基辞書(IPA)ではデータ不足 → NAIST辞書インスコ → それでもたりない → はてなキーワードを使おう ネットに転がっていた 他人のスクリプトを動かしてみる → ふりがながない!エラーでる! → 自分で書こう ・手順 まずは公式からデータ(ID付きじゃない奴)を拝借 http://d.hatena.ne.jp/hatenadiary/20060922/1158908401 以下のスクリプトを実行 ※ 第一引数がファイルの場所 nkf(-e)も付けてね 例:perl convertdic-hatena.pl /etc/hogehoge/hatena.txt | nk

    mima3
    mima3 2013/05/21
  • 1