人工分箱 - shuiwanghuohuo/scorecard_wiki GitHub Wiki
from bin_method import best_bin as bb
bb.Best_Bin(flag_name, factor_name, is_round, data=pd.DataFrame(),bad_name='bad',
good_name='good', piece=5, rate=0.05, min_bin_size=50,
not_in_list=["None", "NaN", "NA", "nan", None,"-999",
"-999.0", -999, "-1111", "-1111.0", -1111],
cut_method='cut_ks', combine_method='combine_iv')
通过指定切割点来分箱
Parameter Description
---------------------
data : pandas.core.frame.DataFrame
数据集
split_knot : list
切割点,连续变量用[1,10,20]表示,离散变量用["女"],["男"](/shuiwanghuohuo/scorecard_wiki/wiki/"女"],["男")表示
factor_name : string
变量名
flag_name : string,(default="label")
标签列列名
type : string,(default="df")
df时返回展开型的分bin
dict时返回dict型的分bin
not_in_list : list,(default=["None", "NaN", "NA", "nan",None, "-999", "-999.0", -999,"-1111","-1111.0",-1111])
空值列表,在列表中的值会被认为空值
Return
------
output : 一个pandas dataframe 包括了特征的变量名,以及相关信息
"""