Evaluation - ktr-skmt/FelisCatusZero GitHub Wiki

自動評価として、システムの解答が模範解答と内容が近いかを概念の重複度で計算するROUGEのスコアを出力します。 ROUGEには様々な値がありますが、ROUGE-1（概念の1-gram）とROUGE-2(概念の2-gram)のF1スコアを出力します。概念単位としては、UniDic辞書+世界史用語ユーザ辞書を用いたMeCabの出力結果から作成する内容語です。

参考：

ROUGE: A Package for Automatic Evaluation of Summaries（PDF）
ROUGE: Recall-Oriented Understudy of Gisting Evaluation - A software package for automated evaluation of summaries

Evaluation - ktr-skmt/FelisCatusZero GitHub Wiki

⚠️ **GitHub.com Fallback** ⚠️

⚠️ GitHub.com Fallback ⚠️