電通デジタルで機械学習エンジニアをしている今井です。 Advent Calendar 9日目となる本記事では、SQLでAUC(Area Under the Curve)を算出する方法について紹介します。 はじめに2値分類タスクでは以下のようなConfusion Matrix(混同行列)を算出します。 TP(True Positive, 真陽性): 正例に対して正例と予測した数 FN(False Negative, 偽陰性): 正例に対して負例と予測した数 FP(False Positive, 偽陽性): 負例に対して正例と予測した数 TN(True Negative, 真陰性): 負例に対して負例と予測した数 またこれらをもとに以下の指標も算出します。 Precision(適合率): $${\frac{\rm{TP}}{\rm{TP+FP}}}$$ Recall(再現率): $${\fra