Evaluation Metric - Raidin/deeplearning-research GitHub Wiki
Object Detection Evaluation Metric
- ์ผ๋ฐ์ ์ธ Classification๊ด์ ์์๋ ์ฌ๋ฌผ ๊ฐ์ฒด ์์ธก์ ์ ํ๋(์ ํํ ์์ธก๋์๋์ง ์ ๋ฌด)๋ง ํ๊ฐํ๋ฉด ๋์ง๋ง, Object Detection์ ๊ฒฝ์ฐ ์ฌ๋ฌผ ๊ฐ์ฒด์ ํด๋์ค(Class) ๋ฐ ์์น(Localization)์ ๋ํ ์์ธก์ ๋์์ ํ๊ฐํด์ผ ๋จ
- ์ ํ๋ ๊ฒ์ฐ์ ์ฃผ๋ก Ground Truth์ ํ์ต๋ชจ๋ธ์ด ์์ธกํ ๊ฒฐ๊ณผ(Prediction)์ ๋น๊ต๋ฅผ ํตํด์ ์ด๋ฃจ์ด ์ง๋๋ฐ, ๋ฐฉ๋ฒ์ผ๋ก IOU(Intersection Over Union)์ด๋ผ๋ ์งํ๋ฅผ ํตํด ์ธก์ ํจ.
IOU(Intersection Over Union)
- 2๊ฐ์ ๊ฒฝ๊ณ๋ฐ์ค(Bounding Box)์ ์ค์ฒฉ์ ๋๋ฅผ ํ๊ฐํ๋ Jaccard Index๋ฅผ ๊ธฐ๋ฐ์ผ๋กํ๋ ์ธก์ ๋ฐฉ๋ฒ
- ์ธก์ ์ ์ํด์๋ ๊ฒ์ถํ๊ณ ์ํ๋ ๊ฐ์ฒด ํด๋์ค์ ์์น๋ฅผ ๊ฐ์ง๋ GT(Ground Truth) bounding box์ ํ์ต๋ Detector๋ก ๋ถํฐ ๊ฒ์ถ๋ bounding box ์ ๋ณด๊ฐ ํ์ ํจ.
- GT์ ์ ํํ๊ฒ ์ผ์นํ ๊ฒฝ์ฐ 1์ ๊ฐ์ ๊ฐ์ง
- ์ผ๋ฐ์ ์ผ๋ก IOU๊ฐ 0.5๋ฅผ ๋์ ๊ฒฝ์ฐ ์์ธกํ๋ค๊ณ ํ๋จ ํจ

Measure
- TP(True Positive) : ๊ฒ์ถํ ๊ฐ์ฒด๋ฅผ ๊ฐ์ฒด๋ผ๊ณ ์ธ์
- TN(True Negative) : ๊ฒ์ถํ ๊ฐ์ฒด๋ ์๊ณ , ์ธ์๋ ์ํจ
- FP(False Positive) : ๊ฒ์ถํ ๊ฐ์ฒด๊ฐ ์๋๋ฐ ๊ฐ์ฒด๋ผ๊ณ ์ธ์
- FN(False Negative) : ๊ฒ์ถํ ๊ฐ์ฒด๊ฐ ์๋๋ฐ, ์ธ์์ ๋ชปํ๊ฒฝ์ฐ
Precision
- ๊ฒ์ถ๋ ๊ฐ์ฒด ์ค ์ค์ ๋ก GT์ ๊ฐ์ฒด์ ์ผ์นํ๋ ๊ฒฝ์ฐ(์ผ๋ง๋ ์ ํํ์ง)
Recall
- ๋ชจ๋ ๊ฐ์ฒด ์ค ์ค์ ๋ก ๊ฒ์ถ๋ ๊ฐ์ฒด์ ๋น์จ(์ผ๋ง๋ ์ ์ฐพ๋์ง)
Average Precision(AP)
- AP๋ ๊ฐ์ฒด ๊ฒ์ถ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๋ ์งํ๋ก ์ฌ์ฉ
- [0:1]์ ๊ฐ์ ๊ฐ์ง๋ recall๊ฐ์ ๋์ํ๋ precision๊ฐ์ผ๋ก ๊ทธ๋ํ(precision-recall)๋ฅผ ๊ทธ๋ฆฌ๊ณ ๋ฉด์ ์ ๊ณ์ฐ
- precision-recall ๊ทธ๋ํ๋ ์ด๋ค ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ ์ ๋ฐ์ ์ผ๋ก ํ์
ํ๊ธฐ์๋ ์ข์ผ๋ ์๋ก๋ค๋ฅธ ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ ์ ๋์ ์ผ๋ก ๋น๊ตํ๊ธฐ์๋ ๋ถํธ ํจ
Compute Average Precision(AP)
- 11-point Interpolation
- [0:1.0] ์ฌ์ด๋ก 11๊ฐ์ recall point๋ฅผ ์์ฑ
- ๋์ ํ๋ precision๊ฐ์ ๊ธฐ์กด graph๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ฐ recall๋ณด๋ค ํฐ recall๊ฐ ๋ค์ด ๊ฐ์ง๋ ์ต๋ ๊ฐ์ผ๋ก ๋์ฒด ํจ
- ๊ทผ์ฌ ๊ฐ์ ๊ณ์ฐํ๋ฏ๋ก ์ ํํ์ง ์์
- Every Point Interpolation(AUC, Area Under Curve)
- ์ต๋ precision๊ฐ์ด ๋ณ๊ฒฝ๋ ๋ ๋ง๋ค ํด๋น ํ๋ recall๊ฐ๋ค์ ๋ํด์ ์ํ๋ง ํ๋ ๋ฐฉ๋ฒ
- ์์๋ก 11๊ฐ point๋ฅผ ๋๋์ง ์๊ณ , ์ธก์ ๋ recall๊ฐ๋ค์์๋ง ๊ณ์ฐํ๋ฏ๋ก precision๊ฐ์ด ์๋ ๊ตฌ๊ฐ์ ๋ํด์ ๊ณ์ฐํ์ง ์์ผ๋ฏ๋ก ๋ณด๋ค ์ ํ ํจ
Self Example
Reference