Missing Data - chaoyue520/XGBoost GitHub Wiki
缺失值处理原则
- XGBoost内置处理缺失值的规则
- 用户需要提供一个和其它样本完全不同的值,然后把它作为一个参数传进去,以此作为缺失值的取值
一般在读取数据的时候设置,如下
na_values = ['','NULL','NA','null','na','Na','-9999','-1','Infinity','NaN']
data_set = pd.read_table('./data_set_0705.txt',sep = '\t' , na_values = na_values)