タグ

@とMLに関するZAORIKUのブックマーク (4)

  • 一般化加法モデル(GAM)について考える - rmizutaの日記

    はじめに 機械学習を現実の問題に適用する場合、そのモデルに説明性が求められることが少なからず存在すると思います。 その場合、精度を犠牲にして線形回帰を実施するでしょうか?木系モデルの重要度を頑張って説明するでしょうか?それともSHAPやLIMEなど線形近似モデルを利用するでしょうか?(まあ銀の弾丸はないんですが) 今回実験を行う一般化加法モデル(GAM)は、線形モデルの利点(説明性)を保ちつつ精度を高められるモデルであるといわれているもので、実際のところどれくらいの感じになるか確認するための実験を行いました。 参考文献 平滑化スプラインと加法モデル | Logics of Blue pyGAM : Getting Started with Generalized Additive Models in Python GAMについて GAMは式としては以下のようになります。 fが全て線形な場合

  • ベイズ混合モデルにおける近似推論③ ~崩壊型ギブスサンプリング~ - 作って遊ぶ機械学習。

    さて、今回は混合モデルに対する効率的な学習アルゴリズムとして、崩壊型ギブスサンプリング(Collapsed Gibbs Sampling)*1を紹介します。ベースとなるアイデア自体はギブスサンプリングそのものなのですが、標準的な方法と比べて種々の計算テクニックが必要になってくるのと、実際に推論精度が向上することが多いのでここで紹介したいと思います。 また、今回の実験で使用したソースコードはGithubにおいてあります。 GitHub - sammy-suyama/MLBlog: source codes used in MLBlog [必要な知識] 下記をさらっとだけ確認しておくといいです。 ポアソン混合モデルにおけるギブスサンプリング ベイズ推論 カテゴリカル分布 1、崩壊型ギブスサンプリングのアイデア 基的なアイデアとしては、対象の確率モデル(同時分布)から一部の確率変数をあらかじめ

    ベイズ混合モデルにおける近似推論③ ~崩壊型ギブスサンプリング~ - 作って遊ぶ機械学習。
  • データ & アナリティクス | アクセンチュア

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    データ & アナリティクス | アクセンチュア
  • トピックモデルシリーズ 4 LDA (Latent Dirichlet Allocation)

    このシリーズのメインともいうべきLDA([Blei+ 2003])を説明します。前回のUMの不満点は、ある文書に1つのトピックだけを割り当てるのが明らかにもったいない場合や厳しい場合があります。そこでLDAでは文書を色々なトピックを混ぜあわせたものと考えましょーというのが大きな進歩です。さてこの記事の表記法は以下になります。前回のUMの場合と同一です。 右2列は定数については数値を、そうでないものについてはR内の変数名を書いています。データは前の記事参照。 グラフィカルモデルは以下になります(左: LDA, 右(参考): 前回のUM)。   見ると四角のプレートがまで伸びてきただけです。しかしながらこれが曲者でUMからかなりのギャップがあります。以下の吹き出しの順に説明していきます。 ① ここではハイパーパラメータからディリクレ分布に従って『文書の数だけ』が生成されます。このは以下のような

    トピックモデルシリーズ 4 LDA (Latent Dirichlet Allocation)
    ZAORIKU
    ZAORIKU 2014/02/24
  • 1