タグ

mecabに関するmyrmecoleonのブックマーク (2)

  • MeCabをブーストさせよう - Qiita

    はじめに MeCabとは日語の形態素解析器をいいます。ここで、形態素というのは言語で意味を持つ最小単位のことです。分割された単語をベクトル化したり、各語彙の頻度を調べたりするために、最小単位に分割するモチベーションが生じます。 そもそもなぜ、形態素解析なんかやるの?っていう動機については、http://qiita.com/Hironsan/items/2466fe0f344115aff177 とかに書かれている通り、(上記の記事では、単語の分割が形態素解析に当たります)、分割された単語をベクトル化したり、各語彙の頻度を調べたりするためです。今回は、MeCabを用いて、できるだけ、精度高く分かち書きできるように頑張ります。1 追記) もう一つのMecabをブーストさせよう(Google Search Console編: https://qiita.com/knknkn1162/items/

    MeCabをブーストさせよう - Qiita
  • 顔文字形態素解析

    最終更新 2012/06/16 説明 MeCabを用いて顔文字を形態素解析して返します。 詳細はこちらを御覧ください。 入力 注意 送信された内容は、ソフトウェアの改善にとどまらず、あらゆる用途に使用される可能性があります。 上のフィールドにデフォで入力されているものは、教師データに使われた顔文字の中からランダムに選ばれたものです。 解析結果の利用は自由ですが、このCGIをAPIのごとく使ったりはしないでください。 1MB以上の入力は削ります。また、巨大なデータはそもそもサーバが受け付けません。 複数行にわたる入力は、最初の1行以外破棄されます。

    myrmecoleon
    myrmecoleon 2012/06/21
    (_´Д`)アイーン の解析結果わらた。
  • 1