先に結論 nDCG@all はどんな予測値やモデルであっても 1.0 に近づくので注意したほうが良さそうです. 疑問 機械学習モデルにおける予測値の評価にはさまざまな指標が用いられます. RMSE prec / recall / f1-score negative log-likelihood 二値分類ではとくに ROC-AUC (Area Under the Receiver Operating Characteristic Curve)1が用いられることが多いでしょう. ランダムな予測値に対する ROC-AUC はその定義上からも 0.5 になることが知られています.これは非常に便利で,ROC-AUC の厳密な定義を知らない人でも「この予測結果はコイントスよりどれだけ優れているのか」がすぐに把握可能です. (ちなみに ROC-AUC については Quality Metrics in R