BigQueryに関するkanda_kのブックマーク (4)

  • SQLでAUCを算出する方法 |Dentsu Digital Tech Blog

    電通デジタルで機械学習エンジニアをしている今井です。 Advent Calendar 9日目となる記事では、SQLでAUC(Area Under the Curve)を算出する方法について紹介します。 はじめに2値分類タスクでは以下のようなConfusion Matrix(混同行列)を算出します。 TP(True Positive, 真陽性): 正例に対して正例と予測した数 FN(False Negative, 偽陰性): 正例に対して負例と予測した数 FP(False Positive, 偽陽性): 負例に対して正例と予測した数 TN(True Negative, 真陰性): 負例に対して負例と予測した数 またこれらをもとに以下の指標も算出します。 Precision(適合率): $${\frac{\rm{TP}}{\rm{TP+FP}}}$$ Recall(再現率): $${\fra

    SQLでAUCを算出する方法 |Dentsu Digital Tech Blog
  • bqコマンドでBigQueryの定期的なスケジューリング設定をしてみよう|Dentsu Digital Tech Blog

    電通デジタルアドベントカレンダー2021 6日目の記事です。 はじめにこんにちは。電通デジタル開発部エンジニアの石原です。 データの分析基盤として、大規模データを扱えて処理が高速なBigQueryはとても便利ですよね。弊社でも日々活用しています。 特にBigQueryで中間テーブルを日々更新したり、分析用のテーブルを定期的に最新化するために、クエリのスケジューリング設定をよく使用しています。 この記事では、bqコマンドを使用してスケジューリング設定を行う際に、特にサービスアカウントを利用し、かつ特定の時間を指定する方法をご紹介します。 よくあるユースケースだと思いますが、Google Cloudの公式ドキュメントの該当ページには詳しく載っていないユースケース(2021年11月時点)なので、ぜひ皆さんの参考になればと思います! 特に、これまでコマンドからスケジューリング設定したことがない方は

    bqコマンドでBigQueryの定期的なスケジューリング設定をしてみよう|Dentsu Digital Tech Blog
  • BigQueryで傾向スコア分析 ~Doubly Robust推定量~|Dentsu Digital Tech Blog|note

    電通デジタルで機械学習エンジニアをしている今井です。 記事では、BigQueryを用いて二重頑健(doubly robust)推定量による効果検証を行うための方法について紹介します。 この記事は過去記事[1]の続編となります。 IPW推定量による効果検証 因果効果とは、仮に介入があった場合のコンバージョン値(例えば購入金額など)と、介入がなかった場合のコンバージョン値の差です。 当然ながら、同一ユーザーにおいてこれらを同時に観測することはできません。 そこで提案されたのが、実際に介入があったTreatment群のコンバージョン値の平均と介入がなかったControl群のコンバージョン値の平均の差分が因果効果である、という平均処置効果(average treatment effect, ATE)です。 しかしながら、現実には交絡因子と呼ばれる介入とコンバージョン値のいずれにも影響を与える要因

    BigQueryで傾向スコア分析 ~Doubly Robust推定量~|Dentsu Digital Tech Blog|note
  • BigQueryでUplift Modeling分析|Dentsu Digital Tech Blog

    電通デジタルで機械学習エンジニアをしている今井です。 記事では、BigQueryでUplift Modeling分析を行うための方法について紹介します。 広告効果を上げるためには? 広告効果とは、広告に接触した場合と接触していない場合とのその後のコンバージョン(CV)の差である、と言えます。 介入が無作為に割り当てられるランダム化比較試験(randomized controlled trial, RCT)において、広告効果は平均処置効果(average treatment effect, ATE)として推定できます。 詳しくは過去記事[1]にまとめています。 Uplift Modelingは「広告施策において、その効果を上げるためには誰を広告配信対象とするべきか」を推定するための方法です。 ユーザーの特徴量を 𝐱𝑖 とすると、Uplift Scoreは下記のように算出されます。 Up

    BigQueryでUplift Modeling分析|Dentsu Digital Tech Blog
    kanda_k
    kanda_k 2020/06/05
    BigQuery ML便利そう
  • 1