タグ

nlpとrubyに関するmaxyのブックマーク (2)

  • LIBLINEARを用いた機械学習入門(単語分割)

    このページでは機械学習のツール(LIBLINEAR)を利用して、実際に分類問題を解くにはどういう手順を経るかということについて解説します。つまり、Kytea(京都テキスト解析ツールキット)における簡易版の単語分割モデルを作ってみようということです。 なお今回はプログラミング言語としてRubyを用いますが、Rubyの知識がなくても実装ができるように解説するよう心がけます。また、必要以上に細かく書いてあるかもしれませんが、不要な方は適宜読み飛ばして下さい。 細かい説明はすっとばしてやり方を見る 機械学習って? 朱鷺の杜Wiki 「機械学習」がわかりやすいかと思います。 ひとことで言うと、「訓練データを与えてそこから機械に問題の解き方を学んでもらい、別の問題を解いてもらうこと」です。 教師あり学習・教師なし学習 機械学習は大きく「教師あり」と「教師なし」に分かれます。 「教師あり学習」とは

  • ヽ(´・肉・`)ノログ(2010-12-08)

    _ [ruby][planet] Ruby で日語を簡単にバラバラにする方法 (この記事はRuby Advent Calendar jp: 2010 : ATNDの8日目です。前日はtakano32さんでした。) 日語をバラバラにする方法っていくつかあるみたいですが,そのうちn-gramと形態素解析を簡単に使えるようにしてみました.形態素解析を使う場合にはYahooの日形態素解析を内部で用いているのでYahooのアプリケーションIDを登録して下さいね.Ruby1.9 で動きます. # -*- coding: utf-8 -*- module StringTokenizer require 'uri' require 'net/http' require 'rexml/document' class IdIsNotSetException < Exception; end def

  • 1