はじめに 千葉大学・株式会社Nospareの川久保です.今回は,二値分類モデルのパフォーマンス評価に用いられる,ROC曲線とAUCと呼ばれる指標を説明します. 感度と特異度 ROC(receiver operating characteristic)曲線とは,ロジスティック回帰モデルなどの二値分類モデルの異なる閾値ごとのパフォーマンスを,二次元平面に図示したものです.より具体的には,横軸に偽陽性率(false positive rate, FPR),縦軸に真陽性率(true positive rage, TPR)をとり,モデルで推定された陽性の確率($y=1$が実現する確率)がいくつ以上であれば陽性と予測するかの閾値を変化させ,偽陽性率と真陽性率の組のプロットを結んだ曲線です. 陰性と分類($B$) 陽性と分類($B^c$)