[기계학습][5주차] 로지스틱 회귀 - mingoori0512/minggori GitHub Wiki

로지스틱 회귀(Logistic Regression)

로지스틱 함수(Logistic Function)

로지스틱 함수란?

  • 아래 그림과 같이 S-커브 함수를 나타냄(실제 많은 자연, 사회 현상에서는 특정 변수에 대한 확률 값이 선형이 아닌 S-커브 형태를 따르는 경우가 많음
  • X값으로 어떤 값이든 받을 수가 있지만 출력 결과(y)는 항상 0에서 1 사이 값이 됨(확률밀도함수(probability density function) 요건을 충족)
  • 시그모이드 함수라고 명명하기도 함

승산(Odds)

승산이란?

  • 임의의 사건 A가 발생하지 않을 확률 대비 일어날 확률의 비율
  • P(A)가 1에 가까울수록 승산은 커지고, 반대로 P(A)가 0이라면 승산은 0

이항 로지스틱 회귀

  • Y가 범주형일 경우, 다중선형 회귀 모델을 적용할 수 없음

이항 로지스틱 회귀의 결정 경계

  • 이항 로지스틱 모델은 범주 정보를 모르는 입력 벡터 x를 넣으면 범주 1에 속할 확률을 반환하며 범주 1로 분류하는 판단 기준은 아래와 같음

로지스틱 회귀 적용