결측값 처리 방법 - leemik3/tensorflow-2.0 GitHub Wiki
결측값 처리 방법
-
결측치 처리 가이드 라인
- 10% 미만 : 삭제 or 대치
- 10% ~ 50% : regression or model based imputation
- 50% 이상 : 해당 컬럼 제거
-
제거하기 (Deletion)
- 전체 행 삭제 (Listwise)
- 단일 값 삭제 (Pairwise)
-
보간하기 / 대치 (Imputation)
- 최빈값
- 중앙값
- 평균
- 조건부 대치
- 회귀분석을 이용한 대치
- Linear Interpolation
-
예측 기법
reference : https://wooono.tistory.com/103