タグ

mecabに関するash1takaのブックマーク (7)

  • 形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog

    概要 偶然57577になっている文章を短歌としてつぶやく Twitter の bot を作りました。 フクロウが鳴くと明日は晴れるので洗濯物を干せという意味 #tanka ウィキペディア日語版「フクロウ」より http://t.co/Dm1uHcQdzR— 偶然短歌bot (@g57577) 2014, 12月 31 再帰的アルゴリズムが有効な問題として有名であり #tanka ウィキペディア日語版「ハノイの塔」より http://t.co/vm2ZqwImKi— 偶然短歌bot (@g57577) 2014, 12月 31 文章はウィキペディア日語版を対象としました。 作り方 jawiki-latest-pages-articles.xml.bz2 をダウンロード。 WP2TXT で上記を扱いやすい形式に変換。 このスクリプト で57577になっている文を抽出。数時間かけて(遅い)

    形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog
  • HugeDomains.com

    Captcha security check g1g0.com is for sale Please prove you're not a robot View Price Processing

    HugeDomains.com
  • mecab-gree-20060411.ppt

    MeCab 汎用日形態素解析エンジン 工藤 拓 アジェンダ 形態素解析技術 辞書引きのアルゴリズム、データ構造 曖昧性の解消 MeCab の開発裏話 歴史 設計方針 汎用テキスト変換ツールとしての MeCab 恐ろしく汎用的! 「意外な」使い方 これから 形態素解析 文を単語に区切り、品詞を同定する処理 全文検索 Spam フィルタリング 人工無能... 以下の3つの処理 単語への分かち書き(tokenization) 活用語処理(stemming, lemmatization) 品詞同定(part-of-speech tagging) すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*,もも,モモ,モモ も 助詞,係助詞,*,*,*,*,も,モ,モ もも 名詞,一般,*,*,*,*

  • MeCab-ruby on Lion | Carpe Diem

    過去に Mecab-ruby on OSX 10.6 という記事を書いたけれど、Lion でもかなりはまったのでメモ。 環境は、Mecab バージョン 0.993 を Lion OSX 10.7.3。 mecab と mecab-ipadic は、homebrew でインストール済み、Ruby は RVM で REE 2012.01 をインストール済みとします。 $ rvm ree $ wget "http://mecab.googlecode.com/files/mecab-ruby-0.993.tar.gz" $ tar zxf mecab-ruby-0.993.tar.gz $ cd mecab-ruby-0.993 $ ruby extconf.rb checking for main() in -lmecab... no checking for main() in -lstdc

  • ■【Mac】【Ruby】mecab-rubyを使ってみた: メモ帳

    mecab-rubyを使ってみましょう! HomebrewやMacPortsでMeCabをインストールしていない人はインストールしてね! 前記事:MeCabのインストール ということで,まずはgemで探して・・・ $ gem search -r mecab-ruby *** REMOTE GEMS *** あれ??ない!? どうやら,ソースを落としてこないといけないみたいです. mecab-rubyダウンロードから最新版をダウンロードしてきてください. $ tar -zxvf mecab-ruby-xxx.tar $ cd mecab-ruby-xxx $ gem build mecab-ruby.gemspec $ gem install mecab-ruby-xxx.gem とすると,インストール完了! テストとして,次のコードを実行してみた. # coding: utf-8 requ

  • Mecabを入れる(Ruby版) : mwSoft blog

    Windows側にしか入れてなかったので、Linux(Fedora10)にもMecabを入れる。その時に打ったコマンド等。(Rubyはインストール済み) ○ダウンロード ここから、「mecab」(体)と「mecab-ipadic」(辞書)と「mecab-ruby」(Ruby用モジュール)をダウンロードする http://sourceforge.net/project/showfiles.php?group_id=177856 ○Mecab体のインストール $ ./configure $ make $ sudo make install という代わり映えのしないコマンド ○Mecab辞書のインストール $ ./configure --with-charset=utf8 $ make $ make install デフォルトだとEUC-JPになるので、お好みに応じてデフォルトキャラセットを

  • マルコフ連鎖で日本語をもっともらしく要約する - ザリガニが見ていた...。

    そもそも、マルコフ連鎖とは何なのか?全く聞いたこともなかった。そして、文章を要約するのはとっても高度なことだと思っていて、自分のレベルではその方法を、今まで思い付きもしなかった。 しかし、以下のようなシンプルなRubyコードでそれが出来てしまうと知った時、目から鱗である...。一体、何がどうなっているのだ?コードを追いながら、マルコフ連鎖を利用するという発想の素晴らしさを知った! 作業環境 MacBook OSX 10.5.7 ruby 1.8.6 (2008-08-11 patchlevel 287) [universal-darwin9.0] mecab utf8環境でインストール済み マルコフ連鎖に出逢う rssを流し読みしていると、以下の日記に目が止まった。(素晴らしい情報に感謝です!) MeCabを使ってマルコフ連鎖 一体何が出来るコードなのか、日記を読んだだけではピンと来なかっ

    マルコフ連鎖で日本語をもっともらしく要約する - ザリガニが見ていた...。
  • 1