タグ

ブックマーク / ibisforest.org (12)

  • K-NEL - 機械学習の「朱鷺の杜Wiki」

    統計科学のフロンティアに続く新シリーズとして企画された新シリーズ確率と情報の科学 の第1巻として出版される「カーネル多変量解析」のサポートページです. カーネル法によるデータ解析は今や生命情報科学やデータマイニングの分野では標準である.しかし文字列やグラフ解析など別分野に適応できるように自身で設計しようとすると容易ではない.書は,カーネル法という多変量解析の底に流れる基的な考え方を紹介して,読者自身が設計を行う際の道標になるような内容をめざす.(岩波書店紹介文より) ↑ 書名: カーネル多変量解析 ―― 非線形データ解析の新しい展開 シリーズ名: 甘利俊一、麻生英樹、伊庭幸人 編 シリーズ確率と情報の科学 (第I期) 著者: 赤穂昭太郎 体裁=A5判・上製・カバー・240頁 定価 3,850円(体 3,500円 + 税10%) 発売日 2008年11月27日 (第1刷) 2009年6

  • リンクマイニング - 機械学習の「朱鷺の杜Wiki」

    リンクマイニング (link mining)† ネットワーク中のノードを結ぶリンク(辺)のパターンや予測を扱うデータマイニング. 文献1によれば,以下のようなタスクがある 対象関連タスク (Object-Related Task) リンクベース対象順位付け (Link-Based Object Ranking) グラフ内の対象を,リンク構造を用いて順位付けする. リンクベース対象クラス分類 (Link-Based Object Classification) グラフ中の対象にラベル付けをする.リンクで関連づけられた対象を同時にラベル付けする点が特徴. 対象クラスタリング (Object Clustering / Group Detection ) 共通の性質をもつ対象をまとめる 対象識別 (Object Identification / entity Resolution ) 実世界の同じ

  • 転移学習 - 機械学習の「朱鷺の杜Wiki」

    転移学習 (transfer learning) / 帰納転移 (inductive transfer)† 転移学習 (transfer learning) の他,帰納転移 (inductive transfer),ドメイン適応 (domain adaptation),マルチタスク学習 (multitask learning),knowledge transfer, learning to learn, lifetime learning などの呼び名もある. 形式的ではないが NIPS2005 Workshop — inductive transfer: 10 years later で示されている次の定義が広く受け入れられると思う. the problem of retaining and applying the knowledge learned in one or more ta

  • 条件付確率場 - 機械学習の「朱鷺の杜Wiki」

    関連文献† John Lafferty, Andrew McCallum, and Fernando Pereira "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data" ICML2001 GoogleScholarAll:Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data C.Sutton and A.McCallum "An Introduction to Conditional Random Fields for Relational Learning":&amazon(0262072882);の一部 Book/Probabili

  • ランダムフォレスト - 機械学習の「朱鷺の杜Wiki」

    ランダムフォレスト (random forest)† ランダムフォレスト (random forest)は多数の決定木を用いたアンサンブル学習.バギングのように,各決定木による多数決で最終的に分類するクラスを決定する.だが,単純なブートストラップサンプリングで分類器を作るのではなく,次の手順で各決定木を学習する. 各決定木の学習に用いる訓練事例集合は,バギングと同様に,(復元抽出の)ブートストラップサンプリングによって生成する. \(M\) 個の特徴があるとき,そのうち \(m\) 個をランダムに選び,その中でCARTのGini係数や,ID3の情報量利得などの規準によって最良の特徴を選ぶ. 木の拡張は最後まで,すなわち,各葉ノードに分類される事例のクラスが1種類になるまで行われ,枝狩りも行わない. -- しましま ↑

  • 確率的勾配降下法 - 機械学習の「朱鷺の杜Wiki」

    確率的勾配降下法 (stochastic gradient descent method)† 予測の誤差関数が \(E^N=\sum_i^NE_i\) のように,各データ点についての誤差の総和で表されているとする.例えば,2乗誤差なら \[E_i=(y_i-f(\mathbf{x}_i))^2\] とすれば, \[E^N=\sum_i^NE_i=\sum_i^N(y_i-f(\mathbf{x}_i))^2\] のように,各データ点の誤差の総和となっている. 最急降下法では \(N\) 個のデータ全体についての勾配を考えた \[\theta\leftarrow\theta-\nabla E^N\] 確率的勾配降下法では,総和の勾配を計算する代わりに,\(i\)個目データについての勾配を計算してパラメータを更新する手続きを \(i=1,\ldots,N\) について行う. \[\theta\

  • クラスタリング - 機械学習の「朱鷺の杜Wiki」

    Freeware† mloss:clustering Cluster Analysis & Finite Mixture Models @ CRAN Task View:統計処理ソフト R の関連パッケージまとめ RjpWikiの関連ページ RjpWiki:Rの基パッケージ中の多変量解析関数一覧 RjpWiki:stats(R 統計)パッケージ中のオブジェクト一覧: 一般的な凝集型階層的クラスタリングのhclustやk-means法のkmeansといった関数を含む RjpWiki:CRANパッケージリスト: clusterパッケージには clara, agnes, diana, fanny, mona, silhouette, xclara のアルゴリズムが含まれる Cluster:クラスタリング (C,perlpython) figue:JavaScript で k-means法 と

  • PRML/course - 機械学習の「朱鷺の杜Wiki」

    必要な事前知識† 微積分:多変量の微分や積分は必要です.ラグランジュの未定乗数法や簡単な変分も必要ですがこれらは付録に簡単な解説があります.複素数の微積分については不要です. 線形代数:3×3以上の固有値・逆行列,行列に対する微積分は必要ですが,これらについては付録に簡単にまとめられています.\(l^2\)空間やヒルベルト空間,複素数については不要です. 確率:基礎については1章で述べられていますが,確率の扱いや考えに慣れていると便利です.確率測度など公理にまで踏み込んだ知識や,統計の検定などの知識は不要です. ↑ 書に関連する分野† 以下の分野でデータからの予測や分析が必要とされる分野 対象分野:書と直接的な関連がある分野には次のようなものがあります. 機械学習,パターン認識,統計,データマイニング 応用分野:機械学習,パターン認識,統計的予測技術が応用されている分野には次のようなも

    mrorii
    mrorii 2010/04/08
  • Weka - 機械学習の「朱鷺の杜Wiki」

    ライブラリ† AlgorithmsForWekaWakka:ファジィc-means法などのファジィ系の手法 BioWeka:バイオインフォマティクス fast-random-forest Fuzzyweka:if-thenルールによるファジィ分類器 jBNC:ベイジアンネットライブラリ HMMWeka:隠れMarkovモデル Olex-GA:文書分類ルールを遺伝的アルゴリズムで獲得 pHMM4weka:隠れMarkovモデルによるタンパク質の分類 Spectral Clusterer for WEKA @ Luigi Dragone:スペクトラルクラスタリング Weka4WS:Grid環境でWekaを実行 WEKA Classification Algorithms:Wekaのプラグイン集.ニューラルネット,学習ベクトル量子化,自己組織化マップなど. Weka LibSVM (WLSVM)

    mrorii
    mrorii 2010/02/14
  • python - 機械学習の「朱鷺の杜Wiki」

    python一般† python.org:公式サイト Wiki Package Index iOS用Python環境 Computable Python for iOS Python Math PyPad Pythonista 英語資料 Python Course:Python のいろいろなトピックについての講義を集めたサイト Python Quick Reference @ Richard Gruet (旧版 日語訳) Google's Python Class OLamp.com -- Python Dev Center:O'Reillyのpython関連ニュース Python Miro Community:チュートリアル講演ビデオのポータル Wikipedia:Python_(programming_language) Python tools that everyone shou

  • Winnow - 機械学習の「朱鷺の杜Wiki」

    Winnow† 目的変数が2値,\(n\)個の特徴量も全て2値の場合の逐次学習アルゴリズム. 線形関数 \(f=w_1x_1+\cdots+w_nx_n\) について,\(f\gt\theta\) なら 1 に,でなければ 0 に分類する.また,係数\(\alpha\gt 1\) を定める. 新たな事例,すなわち,長さ\(n\)の2値ベクトルと2値の目的変数の対が与えられたとき 正しく分類されたなら,重みはそのまま 誤分類された場合は 事例のクラスが1のとき,特徴ベクトルの要素 \(x_i\) が 1 のものは,その重み \(w_i\)を \(\alpha\)倍する. 事例のクラスが0のとき,特徴ベクトルの要素 \(x_i\) が 1 のものは,その重み \(w_i\)を \(\alpha\)で割る. 単純なアルゴリズムだが,PAC学習の観点から理論的な誤り率の限界,\(\alpha\)

  • FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」

    朱鷺の杜Wiki(ときのもり うぃき)† 朱鷺の杜Wikiは,機械学習に関連した,データマイニング,情報理論,計算論的学習理論,統計,統計物理についての情報交換の場です.これら機械学習関係の話題,リンク,関連事項,書籍・論文紹介などの情報を扱います. 更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか,最終更新のページを参照してください. ページの中でどこが更新されたかを見るには,上の「差分」をクリックして下さい. 数式の表示に MathJax を利用しています.数式の上でコンテキストメニューを使うと各種の設定が可能です.特に設定をしなくても数式は閲覧できますが,フォントをインストールすれば数式の表示がきれいで高速になります.詳しくは 数式の表示 のページを参照して下さい. ごく簡単なWikiの使い方がこのページの最後にあります.トップページやメニューなど

  • 1