결측값 처리 방법 - leemik3/tensorflow-2.0 GitHub Wiki

결측값 처리 방법

  1. 결측치 처리 가이드 라인

    • 10% 미만 : 삭제 or 대치
    • 10% ~ 50% : regression or model based imputation
    • 50% 이상 : 해당 컬럼 제거
  2. 제거하기 (Deletion)

    1. 전체 행 삭제 (Listwise)
    2. 단일 값 삭제 (Pairwise)
  3. 보간하기 / 대치 (Imputation)

    1. 최빈값
    2. 중앙값
    3. 평균
    4. 조건부 대치
    5. 회귀분석을 이용한 대치
    6. Linear Interpolation
  4. 예측 기법

reference : https://wooono.tistory.com/103