タグ

ブックマーク / d.hatena.ne.jp/nokuno (4)

  • ノンパラベイズを勉強してみる (2) ディリクレ過程 - nokunoの日記

    ノンパラベイズを勉強してみる (1) unigramとディリクレ分布 - nokunoの日記の続きです。とはいえディリクレ過程は単体で応用されることが少ないので、検索しても混合ディリクレ過程についての情報ばかり出てきてしまいました。単体のディリクレ分布については、最後に書いたのがほとんど全てに近いようです。ディリクレ過程とは 無限次元に拡張されたディリクレ分布のようなもの理論的には無限次元まで増やせるという意味で、最初から無限次元を仮定するわけではない逐次的に次元を増やしていく仕組みが組み込まれている逐次的に生成するモデルだが、出てくる確率は生成した順番に無関係(交換可能)自然言語処理においては、語彙を無限に増やせるunigramの確率モデルとして使える混合ディリクレ過程を使うと、混合分布においてクラスタ数を自動的に決定できるこのようにディリクレ過程はディリクレ分布の拡張ですが、ノンパラメ

  • 2012-01-28 - nokunoの日記

  • 「言語処理のための機械学習入門」を参考に各種モデルに対するEMアルゴリズムを実装したよ - nokunoの日記

    Amazonにもレビューを書いたのですが、高村さんの「言語処理のための機械学習入門」を読みました。実はこのを読むのは2回目で、1回目はドラフト版のレビューをさせていただく機会があったのですが、そのときは「言語処理研究者のための機械学習入門」というタイトルで、ちょっと敷居が高いのではないかとコメントしたら「研究者」の部分が削られたという経緯があったりしました。 それはともかくとして、以前読んだときは時間もなくて実装までする暇はなかったのですが、今度はもうちょっとじっくり読みたいなということで、このブログに書いてみようと思います。EMアルゴリズムは教師なし学習を確率モデルと最尤推定でやろうとするときに必ず出てくる手法で、隠れ変数や欠損値を含む色々なモデルに適用できる汎用的なフレームワークになっています。一般的には混合ガウス分布の場合をまず説明して、それがk-means法の一般化した形になって

  • 論文の探し方 - nokunoの日記

    ふと論文の探し方について書こうと思ったのですが、既にいろいろな方が書かれているのでそちらをまとめます。 自然言語処理 自然言語処理の学会: DO++no titleOverlasting::Life / 2009-11-04自然言語処理のトップカンファレンス - 生駒日記 機械学習 いろんな学会: DO++機械学習/機械学習の論文を探す - とうごろうぃきMeeting - 機械学習の「朱鷺の杜Wiki」 学会名が分かっている場合はそのサイトから、そうでない場合はアーカイブを検索することが多いです。ACL AnthologyACM Digital Library自然言語処理や機械学習の分野については、ひとまず基的な調べ方は分かってきた気がします。ただ、これらの手法を実際に適用しようとするとより効率的な実装が必要となる事が多いので、アルゴリズムやデータ構造、データ圧縮の分野についても論文や

  • 1