kiryuuのブックマーク / 2012年6月26日 - はてなブックマーク

kiryuu id:kiryuu

2012年6月26日のブックマーク (3件)

サービス終了のお知らせ
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
kiryuu 2012/06/26
MeCab
リンク
fukushimuのメモ帳 [mecab] mecab辞書にwikipediaのタイトルリストを追加 [wikipedia][はてなキーワード]
mecabにwikipediaのタイトルの単語を追加します。ググると、既に様々な人がされているので、参考にさせて頂きました。また、本家のサイトで詳しく説明されています。 csvファイルの作成にperlを使いました。以下が作業の流れです。１）wikipediaのデータをダウンロード２）ダウンロードしたデータからユーザ辞書のCSVファイルを作成３）CSVファイルを辞書ファイル（.dic）へ変換 wikipediaのタイトルを辞書に追加すると $ mecab 千と千尋の神隠し千名詞,数,*,*,*,*,千,セン,センと助詞,格助詞,引用,*,*,*,と,ト,ト千尋名詞,一般,*,*,*,*,千尋,チヒロ,チヒロの助詞,連体化,*,*,*,*,の,ノ,ノ神隠し名詞,一般,*,*,*,*,神隠し,カミガクシ,カミガクシ EOS これが $
kiryuu 2012/06/26
MeCab
リンク
mecabのユーザ辞書でwikipediaとhatenaキーワードを利用する - てんぷろぐ
（インストールの仕方などはほかの人がいっぱい説明してくれているので割愛）どうやら標準の辞書だけだと限界があるようので、以下の記事などを参考に「wikipediaとhatenaキーワードをユーザ辞書として利用する」ということをやってみました。 http://d.hatena.ne.jp/code46/20090531/p1 http://www.mwsoft.jp/programming/munou/mecab_hatena.html http://deepneko.dyndns.org/kokotech/2009/06/mecabwikipedia.html 作ったのは以下の2つのスクリプト。 webからデータを取ってきて、csv作成コマンド、辞書作成コマンドを呼び出すshell (convWebWordsToDic.sh) #!/bin/sh CSV=../data/words.c
kiryuu 2012/06/26
形態素解析

mecab
リンク
- 2012年6月29日
- 2012年6月26日
- 2012年6月15日

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx