python_pandas_10 - 8BitsCoding/RobotMentor GitHub Wiki

import pandas as pd

school_id_list = [{'name': 'John', 'job': "teacher", 'age': 40},
                {'name': 'Nate', 'job': "teacher", 'age': 35},
                {'name': 'Yuna', 'job': "teacher", 'age': 37},
                {'name': 'Abraham', 'job': "student", 'age': 10},
                {'name': 'Brian', 'job': "student", 'age': 12},
                {'name': 'Janny', 'job': "student", 'age': 11},
                {'name': 'Nate', 'job': "teacher", 'age': None},
                {'name': 'John', 'job': "student", 'age': None}
         ]
df = pd.DataFrame(school_id_list, columns = ['name', 'job', 'age'])
df.shape

몇 행 몇 열인지 출력

df.info()
df.isna()
# df.isnull()

True, false로 None인지 아닌지 출력

df.age = df.age.fillna(0)

age에서 null을 찾으면 0으로

df['age'].fillna(df.groupby('job')['age'].transform('median'))

None을 평균값으로 대입