99.40.1.1 Regression(회귀) - yojulab/learn_MLs GitHub Wiki
- 데이터에 영향 주는 조건들에 영향력 이용해 데이터에 대한 조건부(가중치) 평균(가장 잘 표현) 구하는 기법.
ex) 우리 나라 아파트 가격 평균은 얼마인가요 ?
- 단순 산술 평균(조건 없이) : 3억 --> 전체 추이로는 의미.
- 구성 요소 가중치 평균(30평수 + 200화장실수 + 100층수 + 500년식) : 개별 예측 가능
조건부 평균
- 구하는 방식 - geogebra
- 독립 변수 1개 : $y = \beta_0 + \beta_1 x_1 (:= y=b+ax [:= y=b+wx]) : y(추정치), bias(편차), \beta_0(가중치), \beta_1(독립변수)$
관련 알고리즘 종류
- Linear Regression
- 일반식(classical) $$y = \beta_0 + \sum^n_{i=1} \beta_i x_i$$
- Logistic Regression
- Multinomial Classification
적당한 조건부 평균 방식
- 오차(Error) 이용 : Loss Function(비용함수), 오차들을 한 수로 표현, $Error = t - \hat{y} = t-(wx+b): t(결과치), \hat{y}(예측치)$
- 주로 MSE(평균제곱오차) 사용 : geogebra, $$MSE=\sum_^n{i=1}[t_1-(wx_i+b)]^2$$
- Optimizer(기울기로 확인) : $$w^{'}=w-\alpa * \raund{loss} / \raund{w} : \alpa(학습률)$$
- 적당한 하이퍼 파라메터 필요.
프로그램으로 살펴보기
- for문을 matrix로 처리 가능 -> 입력 형식을 맞게 바꿈.
- $Y=X\dot W + b : X(matrix), W(matrix), b(scalar)$