Python - jjin-choi/study_note GitHub Wiki
μ 리νκΈ°
200824
Data Analysis
Β§ EDA (Exploratory Data Analysis)
-
import data β check data shape β check data type β check NULL β check μ’ μλ³μμ λΆν¬ β λ 립λ³μ - λͺ λͺ©ν λ³μ λΆν¬ β λ 립λ³μ - μμΉν λ³μ λΆν¬ β μμΉν λͺ λͺ©ν λ³μ κ° κ΄κ³ νμ
- μ’ μ λ³μ : λ€λ₯Έ λ³μλ€μ κ΄κ³λ₯Ό μ£Όλ‘ μΆλ‘ νκ³ μ΅μ’ μ μΌλ‘ μμΈ‘νκ³ μ νλ λ³μ
- λͺ λͺ©ν λ³μ : μΉ΄ν κ³ λ¦¬ μκ° λ무 λ§κ±°λ μ’ μ λ³μμ κ΄λ ¨μ±μ΄ μ μ΄ λ³΄μΌ κ²½μ° μ μΈνκ³ λΆμ
- λ¨λ³μ νμ : seaborn - distplot
-
κ΄λ ¨ module : numpy / pandas / matplotlib / seaborn
Β§ Feature Engineering
// // Β§ Stratified sampling
Performance metrics
Β§