MeCab 用の新語辞書 mecab-ipadic-neologd を公開しました Tweet [NLP] 日本語の文書を機械的に処理しようと思った時に、ほとんどの人が MeCabとIPADIC(IPA辞書)の両方、または、どちらかを使うことになります。 IPADICはとてもよく出来ていますが、更新されないまま年月が過ぎているので、例えば2015年3月上旬に急に流行ったような言葉は収録していません。そのため、今日生まれたような新しい文書(例、Apple Watch発売)を解析する時に困ります。困らない人もいますけど、僕は困ります。 その課題に対処するために、日本全国津々浦々、自然言語処理に関わる全ての人は独自にMeCabの新語辞書を作って対応しているわけです。その際に元データとして使われることが多いのは Wikipedia 日本語版やはてなキーワードなどです。 困ったことに、新語辞書を生成
日経Linuxの2008/2月号の特集を見ながら、SpamAssasinを導入する経過で、MeCabという形態素解析エンジンを利用するCPANモジュールText::MeCabを入れる段でつまづきました。makeやmake testが通らない。どうも64bit環境であることが問題っぽい。 以下に解決法を書いておきます。 cpan -fi Text::MeCab をしてエラーになった後で、/root/.cpan/build/Text-MeCab-0.20001に移動します。そこにあるMakefile.PLを編集し、 my %INFO = ( ABSTRACT => ‘Alternative Interface To libmecab’, AUTHOR => ‘Daisuke Maki <daisuke@endeworks.jp>’, CCFLAGS => $res
MECAPIのソースコード公開 2007-04-01-1 [MECAPI][NLP][Programming] MECAPI[2006-09-18-1]のソースコードを公開。 きちんと書き直そうと思ってたんだけど、手抜きでそのまま公開します。 - MECAPI - MeCab Web Service (MeCab API) https://maapi.net/apis/mecapi - ソースコード ttp://maapi.net/apis/mecapi?mode=code サーバ負荷の問題があるので、大量にアクセス(例えば毎秒数回等)する 人は自分のサーバに設置して使って頂けると幸いです。 ソースは「無償・無保証・著作権放棄」(http://lifehacks.ta2o.net/byebye-copyright.html) ですので、好き勝手に使って下さい。 設置方法: (1) MeCa
かな漢字変換用の2ちゃんねる辞書を 元に、MeCab用の辞書を作った。 ( ・∀・)つ[2ch.dic.2005-09-11-22-47] 辞書の追加の仕方はMeCabのサイトの辞書の追加方法のページを 見て下さい。 なんかあんまり正確でないんで、動詞・形容詞・接続詞の中で変だったやつは消しました。 それでもまだまだ変な定義されてる語が多い……。 あとコストが今んとこ3206で一律なんだけど、どうなんだろう。 $ mecab こんなスレageるなよ厨房 こんな 連体詞,*,*,*,*,*,こんな,コンナ,コンナ スレ 名詞,一般,*,*,*,*,スレ,スレ,スレ ageる 動詞,自立,*,*,一段,基本形,ageる,アゲル,アゲル な 助詞,終助詞,*,*,*,*,な,ナ,ナ よ 助詞,終助詞,*,*,*,*,よ,ヨ,ヨ 厨房 名詞,一般,*,*,*,*,厨房,チュウボう,チュウボう EO
この文章は、さくらインターネット・スタンダードプラン(FreeBSD)でMeCab、ipadic、MeCab Perlモジュールをインストールする際のメモです。ここでのMeCabのバージョンは0.81です。最新版のMeCabではないので気をつけてください。 説明の都合上、カレントディレクトリを「/home/username/」とします。 表示の関係で本来、一行に記述しなければならないのに改行して表示されている個所があります。注意してください。 ◆準備 アーカイブファイルをダウンロードします。 http://chasen.naist.jp/stable/ipadic/ipadic-2.4.4.tar.gz http://prdownloads.sourceforge.jp/mecab/14968/mecab-0.81.tar.gz http://prdownloads.sourceforge
* [近況] またあいた もう3月。まだ一段落つきません。ふぅ。引き続き正社員、契約社員、バイト募集中です。興味のある方はご一報を。 * [Perl][メモ] Inline::CでMeCabのXSモジュール Advanced Perl Programming (2nd ed)を読んでInline::C経由でXSモジュールをつくるのを試してみたくなりました。で、MeCabをWindowsでSWIGなしで動かすのにXSモジュールをつくってみることにしました。まずはText::MeCabにInline::Cを使ってガリガリコードを書いて、コンパイルが通ったらnocleanオプションで削除されずに残ったXSファイルをほぼそのまま利用します(Inline.hを移したりMODULE名とかは書き換えたり)。 できたのがこちらText-MeCab-0.03.tar.gz Text-MeCab-0.04.t
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く