[B! EMアルゴリズム] simakawaのブックマーク

EMアルゴリズム徹底解説 - Qiita

ステップ2 $r_{nk}$を固定して$J$を$\mu_k$で偏微分して最小化します。式変形をすると、クラスタ$k$の最適なCentroidは上記のように、クラスター$k$に所属しているデータの平均であることがわかりました。上記より最初のデモンストレーションで行っていたアルゴリズムは損失関数$J$の最適化によって導出されたものを適用していたことがわかります。 2−3. 実装上記で示した２ステップを計算して、イテレーションを回すだけのシンプルなプログラムです。最後に更新前のmuと更新後のmuの差を取り、それがある程度小さくなったら収束したと判断し、イテレーションを止めるようにしています。下記はアルゴリズム部分の抜粋です。プログラムの全文はコチラにあります。 for _iter in range(100): # Step 1 =============================

simakawa 2019/06/29

　混合ガウスモデル

リンク

HMM: 隠れマルコフモデル - システム工学基礎

HMM:隠れマルコフモデル電子情報工学科伊庭斉志  一次マルコフ連鎖  状態集合 S={1,2,…n}  遷移確率(k→ｌ) akl  隠れマルコフモデル（Hidden MM:HMM）  出力記号集合Σ  出力確率(状態から出力記号への写像) ek(b) : S → Σ マルコフモデルと隠れマルコフモデル  HMM≒有限オートマトン＋確率  定義  出力記号集合Σ  状態集合 S={1,2,…n}  遷移確率(k→ｌ) akl  出力確率 ek(b)  開始状態終了状態 0.4 0.6 0.3 0.7 0.5 0.5 1 2 3 A: 0.2 B: 0.8 A: 0.7 B: 0.3 A: 0.1 B: 0.9 隠れマルコフモデル(HMM) Rain Dry 0.7 0.3 0.2 0.8 • ２つの状態: ‘Rain’ と ‘Dry’. • 推移確率:

simakawa 2017/07/01

リンク

『EMアルゴリズム』

ぽんのブログ自分用の備忘録ブログです。書いてある内容、とくにソースは、後で自分で要点が分かるよう、かなり簡略化してます（というか、いい加減）。あまり信用しないように（汗前回、前々回のベータ分布、ガンマ分布の最尤推定のアルゴリズムを眺めていると、そのままEMアルゴリズムの更新式を求められそうですね。 AIC のところで出てきたコーシー分布もEM法に持っていけそうです。まぁ、コーシーのところで紹介した元論文は、元々混合 t 分布のEMアルゴリズムについてのものでしたし。ガンマやベータ分布については、前回・前々回載せた最尤推定法に基づいたEMアルゴリズムでは実用性は疑問かもしれません・・・引用論文でも、最尤推定値への収束は遅い、とあるのでEMアルゴリズムではなおさらかも。なにより、ガンマとかベータ分布の使いどころが想像できない・・・・・まぁ、でも色々な分布について一応更新式を載せてゆき

simakawa 2017/06/05

リンク

EMアルゴリズムを使って多峰型分布をモデル化してみる - Qiita

概要標本から得られた分布が多峰型であったとき, 単純なガウス分布でモデル化するのは適切ではありません. 多峰型の分布は複数のガウス分布を組み合わせた混合ガウス分布を使ってモデル化することができます. この記事ではEMアルゴリズムを使って, 混合ガウス分布のパラメータを決定する例を紹介します. まずは単峰型分布から最尤推定標本を$x_n (n=1,…,N)$とします. ガウス分布の最尤推定によって, 平均と分散を以下の形で求めることができます. \mu_{ML}=\frac{1}{N}\sum_{n=1}^N x_n \\\ \sigma^2_{ML}=\frac{1}{N-1}\sum_{n=1}^N (x_n-\mu_{ML})^2 # -*- coding: utf-8 -*- import numpy as np import matplotlib.pyplot as plt

simakawa 2017/06/04

リンク

今更聞けないEMアルゴリズムの解説

simakawa 2017/06/04

emアルゴリズム

リンク

最尤推定と EM アルゴリズム - kenta1984の日記

最尤推定と EM アルゴリズムのまとめ。基本的には、最尤推定の発展バージョンが EM アルゴリズム。言い換えれば、EM アルゴリズムは最尤推定が基本にあるために、EM アルゴリズムを理解するためには最尤推定を理解することが必須。最尤推定最尤という言葉のせいで難しいイメージがあるが、極めて簡単。表が 0.3 の確率で出るコイン A と表が 0.8 の確率で出るコイン B があるとする。今、A か B か分からないがどちらかのコインを 3 回続けて投げたら、表、裏、表という順番で出た。さあ、どっちのコインを投げたでしょう？このときに最尤推定を使えば簡単に分かる。（というか、最尤推定使わなくても感覚で分かるけど…）コイン A を使ったときの確率（＝尤度）は、 0.3　×　（1−0.3）　×　0.3　＝　0.063 コイン B を使ったときの確率（＝尤度） 0.8　×　（1−0.

simakawa 2017/06/04

リンク

MLAC2013 数式を使わずイメージで理解するEMアルゴリズム - Wolfeyes Bioinformatics beta

はじめに Machine Learning Advent Calendar 2013の15日目を担当する@yag_aysです．専門はバイオインフォマティクスという計算機を使って生物学をする分野で，生モノではなく遺伝子の文字列相手に格闘している大学院生です．今回は初心者の人を対象に，なるべく数式を使わずにEMアルゴリズムについて解説してみたいと思います． EMアルゴリズムは，SVMやニューラルネットワークといった華々しい機械学習の手法の一つではなく，機械学習の中で使われる尤度最大化という一部分を担当するアルゴリズムです．そのため多くの人にとってEMアルゴリズムは，それ単体を使ってみたりだとか独自に改良をしたりするような対象ではないでしょう．でも，EMアルゴリズムなんて仰々しい名前が付けられているだけあって，いざ自分の仕事に組み込む場合には中身を理解していないと「なぜEMアルゴリズムを使ったの

simakawa 2014/01/08

EMアルゴリズム

リンク

EMアルゴリズムによる混合分布のパラメーター推定の解析計算＆実装例 from 「Rによるモンテカルロ法入門」 - My Life as a Mock Quant

問題設定 R言語の書籍「Rによるモンテカルロ法入門」のEMアルゴリズムに関連した「練習問題5.14」をpthonの練習がてらEMアルゴリズム構築までの数式もメモりながら解いてみたというお話。問題設定としてはという混合分布(分布から確率、分布から確率でサンプリング)から個サンプリングした状況を考えて、このパラメーターをEMアルゴリズムで推定するというもの。機械学習の分野でいう所の「教師なし２クラス分類」に該当する（たぶん）。グラフを使ってもうちょっとちゃんと説明しておくと、実際に観察された青い棒グラフで示されているデータは赤色のグラフで示されているからのサンプルなのか、それとも緑色のグラフで示されているからのサンプルなのかを識別するための閾値的な量になっているというパラメーターを推定してましょうと、そして、既存のデータはのどちらの分布から来た可能性が高いのかを判断しましょうとそういう問

simakawa 2014/01/08

EMアルゴリズム

リンク

EMアルゴリズム | データサイエンティストに俺はなる！

simakawa 2014/01/08

EMアルゴリズム

リンク

EMアルゴリズム (The Expectation Maximization)

EM アルゴリズム (The Expectation Maximization) 一般にデータは不完全であり、それに基づいて推定しなければならない場合が多い。また、複雑な尤度関数の場合、最尤推定値を求めることは困難な場合がある。 EM アルゴリズムは不完全データの問題を完全データのフレームワークで逐次的にパラメーターの最尤推定量を求めてゆく方法で、計算自体より実行し易いアルゴリズムである。ただし、局所的な極大に到達してしまう可能性がある。完全データ： , 不完全データ（観測データ）：Y 、欠失データ： ) , ( Z Y X = Z : ) (X t Y = X からY への射影＜EM アルゴリズムの手順＞パラメーターベクトルϑ の下での X の分布密度： ) ( ϑ X f ① [ n n Y X f E Q ϑ ϑ ϑ ϑ , ) ( log ) ( = ] ：

simakawa 2014/01/08