再現率・適合率 前回のエントリの引用. Precision:適合率 検索結果に適合しない文書が入ってない割合 Recall:再現率 適合する全ての文書の内,どれだけ拾うことが出来たかの割合 計算式は以下の表を用いて Relevant Nonrelevant Retrieved tp fp Not Retrieved fn tn Precision(P) = tp / (tp + fp) Recall(R) = tp / (tp + fn) となる. PとRはトレードオフの関係である. 検索結果として全ての文書を返せば,R→1となるがP→0となる. 条件を厳しくして適合文書をほんの少しだけ返せばPは大きくなるが,Rは小さくなる. 例を挙げてみる. 文書集合内の文書の数は10コ. 検索結果として10コの文書を返す. 正解となる文書(適合文書)は4コ. 適合文書の出現順序は以下の通り. ランキン