Missing Data - chaoyue520/XGBoost GitHub Wiki

缺失值处理原则

  • XGBoost内置处理缺失值的规则
  • 用户需要提供一个和其它样本完全不同的值,然后把它作为一个参数传进去,以此作为缺失值的取值

一般在读取数据的时候设置,如下

  na_values = ['','NULL','NA','null','na','Na','-9999','-1','Infinity','NaN']

  data_set = pd.read_table('./data_set_0705.txt',sep = '\t' , na_values = na_values)