Evaluation - ktr-skmt/FelisCatusZero GitHub Wiki
自動評価として、システムの解答が模範解答と内容が近いかを概念の重複度で計算するROUGEのスコアを出力します。 ROUGEには様々な値がありますが、ROUGE-1(概念の1-gram)とROUGE-2(概念の2-gram)のF1スコアを出力します。 概念単位としては、UniDic辞書+世界史用語ユーザ辞書を用いたMeCabの出力結果から作成する内容語です。
参考:
自動評価として、システムの解答が模範解答と内容が近いかを概念の重複度で計算するROUGEのスコアを出力します。 ROUGEには様々な値がありますが、ROUGE-1(概念の1-gram)とROUGE-2(概念の2-gram)のF1スコアを出力します。 概念単位としては、UniDic辞書+世界史用語ユーザ辞書を用いたMeCabの出力結果から作成する内容語です。
参考: