情報検索入門シリーズ。 テストコレクション(test collection)とは、評価用データセットのこと。 特に、様々な研究機関が共有し、異なる研究環境間でも評価結果の比較ができるようしたものを 自前の評価用データと区別するために標準テストコレクション(standard test collection)と呼ぶこともある。 情報検索のテストコレクションは通常、検索対象である文書セットと、検索課題セットと、各検索課題に対する正解(適合文書)セットから構成される。 検索システムを評価する際には、各検索課題をシステムに与えて得られた検索結果に対し平均精度などの評価指標を計算し、さらに評価指標の検索課題セットに関する平均などを算出する。 テストコレクションは歴史的に数百~数千件の文書を扱うものが多かったが、1992年に米国の評価型ワークショップTREC(Text Retrieval Con