python_pandas_10 - 8BitsCoding/RobotMentor GitHub Wiki
import pandas as pd
school_id_list = [{'name': 'John', 'job': "teacher", 'age': 40},
{'name': 'Nate', 'job': "teacher", 'age': 35},
{'name': 'Yuna', 'job': "teacher", 'age': 37},
{'name': 'Abraham', 'job': "student", 'age': 10},
{'name': 'Brian', 'job': "student", 'age': 12},
{'name': 'Janny', 'job': "student", 'age': 11},
{'name': 'Nate', 'job': "teacher", 'age': None},
{'name': 'John', 'job': "student", 'age': None}
]
df = pd.DataFrame(school_id_list, columns = ['name', 'job', 'age'])
df.shape
몇 행 몇 열인지 출력
df.info()
df.isna()
# df.isnull()
True, false로 None인지 아닌지 출력
df.age = df.age.fillna(0)
age에서 null을 찾으면 0으로
df['age'].fillna(df.groupby('job')['age'].transform('median'))
None을 평균값으로 대입