기계학습_당뇨병 환자 예측 문제(QDA 연습문제) - mingoori0512/minggori GitHub Wiki
당뇨병 환자 예측 문제
Overview
당뇨병 환자 예측 문제 -주어진 데이터를 이용하여 당뇨병이면 1, 당뇨병이 아니면 0으로 카테고리를 분류하는 문제입니다. -Evaluation: Categorization Accuracy를 사용합니다. -현재 베이스라인은 Logistic Regression의 디폴트 옵션을 사용합니다. -현재 문제의 경우 랜덤시드 설정유무로 성능의 변동은 없습니다만, 지금부터 랜덤시드 고정시키는 연습을 하고자 아래의 코드를 노트북에 복사붙여넣기 하여 사용해 주시기 바랍니다.
import random import os seed = 42 random.seed(seed) np.random.seed(seed) os.environ["PYTHONHASHSEED"] = str(seed)
Description
-
Data Pregnancies : 임신 횟수 Glucose : 글루코오스(탄수화물 화합물) BloodPressure : 혈압 SkinThickness : 피부 두께 Insulin : 인슐린 수치 BMI : BMI 지수 DiabetesPedigreeFunction : 가족력 Age : 나이 Diabetes : 당뇨병이면 1, 당뇨병이아니면 0
-
File data.csv : 당뇨병 데이터 + 당뇨병 보유 여부(0 or 1) X_test.csv : 당뇨병 보유 여부외에는 train 데이터와 동일 submit.csv : submission 파일의 예시
Data Loading
Data Modeling
- Fitting
- Submission