非常に密接な関係があったわけですが、これまでIR(Information Retrieval)系の勉強は全然していませんでした。 確率モデルによる検索順位決定方式は、基本的には検索クエリー中の語が、文書中に出現する確率で決めます。 語tと文書dの適合度 は、なぜかd中でのtの出現回数 TF (Term Frequency)が一般的です。 もっと他の計算方法使ってもいいのに クエリーq中における語tの重みの方をどのように工夫するかです。 適合文書とは、検索クエリーに対するふさわしい文書のことです。