タグ

人工知能に関するsuslovmikhailのブックマーク (3)

  • 20 Newsgroupsで分類精度を評価 - 人工知能に関する断創録

    ナイーブベイズを用いたテキスト分類(2010/6/13)の続きです。前回、実装したナイーブベイズの分類精度を評価してみます。テキスト分類のベンチマークとして使われるのは Reuters-21578 20 Newsgroups といったデータセットです。今回は、ナイーブベイズの分類精度を20 Newsgroupsで評価してみたいと思います。論文は散々読んだけど自分で試すのは初めてなんだよなー。 20 Newsgroups http://qwone.com/~jason/20Newsgroups/ Usenet*1から収集した約20000文書、20カテゴリのデータセットです。カテゴリは下の20個。まあ何となくどんなカテゴリなのかわかりますね。おおまかにcomp、rec、sci、talkに分けられるので4カテゴリとして扱うこともあるようです。 comp.graphics comp.os.ms-w

    20 Newsgroupsで分類精度を評価 - 人工知能に関する断創録
  • 機械学習 - 機械学習の「朱鷺の杜Wiki」

    機械学習とは,Arther Samuel によれば「明示的にプログラミングすることなく,コンピュータに行動させるようにする科学」 のことです. 歴史的には,人工知能の研究分野の中で,人間が日々の実体験から得られる情報の中から,後に再利用できそうな知識を獲得していく過程を,コンピュータにおいて実現したいという動機から生じました. 現在では,数値・文字・画像・音声など多種多様なデータの中から,規則性・パターン・知識を発見し,現状を把握や将来の予測をしたりするのにその知識を役立てることが目的となっています. しましまの私見に基づいて,機械学習の各種の問題を整理しました. ↑ 他分野との関連† 確率論:機械学習で扱うデータは,いろいろな不確定要素の影響を受けており,こうして生じた曖昧さを扱うために利用されます. 統計:観測されたデータを処理する手法として長く研究されてきたため深い関連があります.特

  • Gunosyの成長を支えている「実験」 | ライフハッカー・ジャパン

    はじめまして、株式会社Gunosy(グノシー)の関です。社内では、推薦システムの開発を中心とした研究開発領域を担当しています。 前回の記事のテーマは、Gunosyを立ち上げた頃からこれまでの話と、Gunosyが目指す世界観についてでした(「僕がGunosyを続ける理由」、CEOの福島が書きました)。今回は、Gunosyの根幹であるニュース推薦システムについて、その技術的背景と設計思想についてお話しします。 推薦システムとはなにか 僕たちは、ユーザーの皆さんの興味をSNSでの行動やGunosy内での行動から分析し、毎日ウェブ上にあふれる情報から一人一人の興味にあった情報を届ける「Gunosy」というサービスを開発・運営しています。そして、このサービスを実現するために用いられている技術が推薦システムです。 ウェブに関わる仕事をしている方であれば、推薦システム、あるいはレコメンデーションシステム

    Gunosyの成長を支えている「実験」 | ライフハッカー・ジャパン
  • 1