クエリの評価QPP - HigashiKed/patent_prior-art_search GitHub Wiki

pre retrieval

AvIDF,AvICF, SCQ, NSCQ

  • AvIDF
    iDFの平均に基づいてクエリの難易度を決定する

  • AvICF
    iDFを使用するかわりにクエリのTFを使用

  • SCQ

  • NSCQ

AvIDFやAvITFはnDCGとの相関低い
SCQ,NSCQはTF,IDFを利用していて、nDCGとの相関が高い.
→tf,idfを用いて評価する = SCQで

https://lucene.apache.org/core/4_0_0/core/org/apache/lucene/search/similarities/TFIDFSimilarity.html