タグ

mecabに関するtakepierrotのブックマーク (3)

  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点
    takepierrot
    takepierrot 2014/04/01
    Python使ってるけど、これくらいならPerlで書きなおしできそうやな
  • Tomarigi | PaWeL:日本語表現法開発プロジェクト-青山学院大学-

    ダウンロード Tomarigi v324 ※v324では,読点のチェックに関するバグの修正と 大量の文を解析した際に,リソース不足でエラー終了する問題を修正していますが, このリソース不足対応処理を入れたことで,結果表示の速度が落ちています. また,検証した結果40000文字,1000文程度が限度のようです. ツールが想定している小論文は,2000文字程度までですので, それを踏まえてご使用下さい. Tomarigi v325 ※v325では,ポータブル環境構築のバグを修正しました. ※下記のインストール方法では,Mecab 0.996・Cabocha 0.68の利用を案内しておりますが PC環境によっては,これらのバージョンが動作しない場合があります. その場合は,上記バージョン以上のMecab・Cabochaをインストールし,ご利用下さい. MecabやCabochaを単独で実行した

    takepierrot
    takepierrot 2014/03/31
    こりゃすごいなあ。係り受け解析から文章の校正ってどうやるんだろう
  • HugeDomains.com

    Captcha security check g1g0.com is for sale Please prove you're not a robot View Price Processing

    HugeDomains.com
    takepierrot
    takepierrot 2014/03/31
    MacへのMeCabのインストール手順が詳しい。HomebrewでMeCabも辞書も一緒にインストール可能。
  • 1