情報検索入門シリーズ。 検索のための文書のスコア付け手法として最も基本的なtf-idfの、 idf(inverse document frequency)の部分の考案者がKaren Sparck Jonesであることについては 以前述べた。ではtf(term frequency)の考案者は? 答えはベクトル空間モデルの発明者Gerard Salton、ではなくて、H.P. Luhnだろう。 ちょうど半世紀前に書かれた文献[1]にこんな文が出てくる。 There is also the probability that the more frequently a notion and combination of notions occur, the more importance the author attaches to them as reflecting the essen