タグ

2022年9月28日のブックマーク (4件)

  • グラフィカルモデルによる確率モデル設計の基本 - 作って遊ぶ機械学習。

    今回から数回にわたって、グラフィカルモデルを利用した確率モデルの設計についてお話しします。従来の統計モデルと比べ、機械学習機械学習たらしめているものの一つは、扱う現象の複雑さにあると言えます。複雑な現象を解析するためにはそれに見合った複雑なモデルが必要で、それを簡潔に記述するための方法としてグラフィカルモデルが開発されました。 「グラフィカルモデルを使って現象をモデル化し、必要に応じて近似推論法を用いて未知の値を推定する」 という一連の流れが身につくと、いろんなデータサイエンスの課題に対してシンプルかつフォーマルに取り組めるようになります。 それではまず始めに、超超超重要な確率の加法定理と乗法定理の確認をしてみましょう。 ・加法定理(sum rule)*1 \[ p(x) = \sum_y p(x,y) \] ・乗法定理(product rule) \[ p(x,y) = p(x|y)p

  • 【構造学習】CausalNexで有向非循環グラフ(DAG)推定 -説明変数(テーブルデータ)の因果推論に挑戦-|はやぶさの技術ノート

    変数xが変数yに影響を与えるなど、向きが明確な場合は矢印(有向エッジ)を用います。一方、因果はあるけど、向きが分からない場合は線のみ(無向エッジ)で結合します。 ここでいう変数(青●)をノード、矢印をエッジと呼ぶこともあります。グラフ関連の用語については、以下の記事で紹介しています。 PyTorch GeometricでGraph Neural Network(GNN)入門グラフニューラルネットワーク(GNN:graph neural network)とグラフ畳込みネットワーク(GCN:graph convolutional network)について勉強したので、内容をまとめました。PyTorch Geometricを使ったノード分類のソースコードも公開しています。... 循環グラフとは 下図のように、あるノード(変数zなど)を起点としたとき、巡り巡って変数zに戻ってくるグラフのことを循環

    【構造学習】CausalNexで有向非循環グラフ(DAG)推定 -説明変数(テーブルデータ)の因果推論に挑戦-|はやぶさの技術ノート
  • グラフィカルモデルに基づく因果探索手法の調査 - Fire Engine

    最近,因果推論や因果探索に興味を持ち,勉強している.というのも最近,ゆううきさん と一緒に分散システムの異常の原因を即時に診断するための研究を進めている.原因を診断するためのアプローチとして,サーバやコンテナ等から取得できる様々なメトリック(CPU使用率やメモリ使用率など)を(グラフ理論における)ノードとして,因果グラフを構築することを考えている.メトリック同士の単なる「相関」ではなく,結果と原因の関係である「因果」を捉えようとするアプローチである.例えば,システムの障害が発生した場合,相関だけでは,AとBが関連がありそうというところまでしか言えないが,因果を特定できると理想的には,Aの原因はBであるといった議論ができるため,有用だと考えている. 実際に,前述のような因果グラフを構築して障害の原因を特定しようというアプローチは,以下の例に挙げるようにここ数年で増えている印象がある. 「Mi

    グラフィカルモデルに基づく因果探索手法の調査 - Fire Engine
  • pythonで因果推論 ~データセット紹介~ - Qiita

    はじめに 因果推論の実験に使えるデータセットをpythonでの読み込み方法とともにまとめた記事です。 想定している読者 主にRubin因果モデルに従った手法による因果推論を実装したい それぞれのデータセットの特徴を知りたい (pythonで)すぐに自分の環境でデータセットを読み込みたい 因果推論とデータセット データセット紹介の前に、少しだけ表題の解説を行います。基礎的な部分なので、読み飛ばしていただいて大丈夫です。 因果推論の手法の評価実験では、通常のテーブルデータを用いることは少なく、多くの場合、因果推論専用のデータセットによって手法の評価を行います。その理由は簡潔に言うと、「通常のデータには正解データが無いから」であり、これは「因果推論の根問題」という問題と関連します。 因果推論の根問題とは、ある介入を行った場合と行わなかった場合の両方の効果を同時には観測できないと言う問題です。

    pythonで因果推論 ~データセット紹介~ - Qiita