offline_cor - shuiwanghuohuo/scorecard_wiki GitHub Wiki
eliminate_high_corr(train_data_woe, train_data_stat, not_var_list=[], corr_rate=0.7)
Explanation
----------
筛选出相关系数小于指定阀值的变量
对于相关系数大于等于指定阀值的变量,只保留iv最大的变量
Parameters
----------
train_data_woe:pandas.core.frame.DataFrame
训练集woe化样本
train_data_stat:pandas.core.frame.DataFrame
训练集指标表现
not_var_list:list
不参与筛选的指标列表
corr_rate:float
相关系数阀值
Return
------
corr_list:list
训练集相关系数小于指定阀值的指标名称list