offline_cor - shuiwanghuohuo/scorecard_wiki GitHub Wiki

eliminate_high_corr(train_data_woe, train_data_stat, not_var_list=[], corr_rate=0.7)
Explanation
----------
筛选出相关系数小于指定阀值的变量
对于相关系数大于等于指定阀值的变量,只保留iv最大的变量

Parameters
----------
train_data_woe:pandas.core.frame.DataFrame
    训练集woe化样本

train_data_stat:pandas.core.frame.DataFrame
    训练集指标表现

not_var_list:list
    不参与筛选的指标列表

corr_rate:float
    相关系数阀值

Return
------
corr_list:list
    训练集相关系数小于指定阀值的指标名称list