タグ

ブックマーク / ibisforest.org (5)

  • しましま/IBIS2013 - 機械学習の「朱鷺の杜Wiki」

    第16回 情報論的学習理論ワークショップ (IBIS2013)† このページはしましまが IBIS2013 に参加してとったメモです.私の主観や勘違いが含まれていたり,私が全く分かってなかったりしていますので,その点を注意してご覧ください.誤りがあれば,指摘してください. チュートリアル1:機械学習概要† 村田 昇(早稲田大学) 学習とは『賢くなる手続き』 スパムメール,Googleの検索,推薦システム,Watson将棋,徴税システム 計算論的学習理論 人工知能とアルゴリズムの初期研究:決定的 → 確率的・非決定的な考え方の登場 80年代の Valiant 十分な確率で正解に達すればよい → PAC学習 統計的学習理論 確率的近似法(統計的探索に確率探索の手法を導入)→ 学習系の平均挙動の統計的解析 → VC次元の理論と発展 学習問題の枠組み 教師あり(回帰,識別)・教師なし(クラスタリ

    morioka
    morioka 2013/11/11
  • complement naive Bayes - 機械学習の「朱鷺の杜Wiki」

    多項モデル† 単純ベイズで文書分類をする場合によく用いられるのが多項モデル. 単純ベイズでは,文書 \(\mathbf{x}_i\) が与えられたとき,クラス \(c\) になる確率は次式 \[\Pr[c|\mathbf{x}]\propto\Pr[\mathbf{x}|c]\Pr[c]\] \(w\) 種類の語があるとき,文書ベクトル \(\mathbf{x}_i=(x_{i1},x_{i2},\ldots,x_{iw})\) の要素は,語 \(j\) が文書 \(i\) 内で生じる回数. 多項モデルでは,この要素の頻度が多項分布に従うとする.クラス \(c\) の任意の文書のある語を選んだとき,その語が語 \(j\) である確率を \(\theta_{cj}\) で表す.すると,文書 \(\mathbf{x}_i\) は次式で決まるクラスに分類される \[\arg\max_c=\ln\

    morioka
    morioka 2008/12/18
  • しましま/人工知能学会全国大会2007 - 機械学習の「朱鷺の杜Wiki」

    プライバシアウェアなPeer-to-Peer k-meansクラスタリング† 佐久間 淳 (東京工業大学),小林 重信 (東京工業大学) k-means法をP2PでPPDMする.最初に公開鍵をブロードキャストするなど,大域的なサーバが一つ必要. ↑ 形式概念に基づく Top-N 楽曲クラスタリングに関する一考察† 大久保 好章 (北海道大学 大学院情報科学研究科コンピュータサイエンス専攻),原口 誠 (北海道大学大学院情報科学研究科 コンピュータサイエンス専攻) SMFファイルの連続する一定数のデータの局所的な類似性が一定値以下の,特徴集合と事例の極大な集合を見つける. ↑ 半正定性を満たす類似性尺度の高速推定手法† 桑島 洋 (大阪大学産業科学研究所 知能システム科学研究部門高次推論方式研究分野),中西 耕太郎 (大阪大学産業科学研究所 知能システム科学研究部門高次推論方式研究分 鷲尾

    morioka
    morioka 2008/05/12
  • CluStream - 機械学習の「朱鷺の杜Wiki」

    CluStream† データストリームのためのクラスタリング手法. ストリームのいろいろな期間のクラスタを調査できるように,pyramidal time frame構造で,いろいろな時期のデータのスナップショットを保持. スナップショットは,時間間隔を変えて複数の系列でとる. 次数 \(i\) のスナップショットの系列は,間隔 \(\alpha^i\) ごとに取得. 各次数ごとに最新のものを一定数個ずつ保存する 異なる次数で,重複したスナップショット保持しなくて済むので,総スナップショット数は抑制できる スナップショットは,BIRCHやSTREAMと同様に,マイクロクラスタと呼ぶ小さなクラスタの集合で表し,最終クラスタはこれらのマイクロクラスタをまとめたものになる. マイクロクラスタは,初期的にはk-means法で生成.新たなデータは,既存マイクロクラスタに分類するか,新たなマイクロクラス

    morioka
    morioka 2008/02/16
  • DataSet - 機械学習の「朱鷺の杜Wiki」

    テスト用データ集合† アルゴリズムの比較検証に利用できるテスト用データについてまとめましょう. ID は ibis でパスワードは VC 次元の V のフルスペルです(頭だけ大文字)

    morioka
    morioka 2007/03/20
  • 1