人工分箱 - shuiwanghuohuo/scorecard_wiki GitHub Wiki

from bin_method import best_bin as bb
bb.Best_Bin(flag_name, factor_name, is_round, data=pd.DataFrame(),bad_name='bad', 
         good_name='good', piece=5, rate=0.05, min_bin_size=50, 
         not_in_list=["None", "NaN", "NA", "nan", None,"-999", 
                      "-999.0", -999, "-1111", "-1111.0", -1111],
         cut_method='cut_ks', combine_method='combine_iv')

通过指定切割点来分箱

Parameter Description
---------------------
data : pandas.core.frame.DataFrame
    数据集

split_knot : list
    切割点,连续变量用[1,10,20]表示,离散变量用["女"],["男"](/shuiwanghuohuo/scorecard_wiki/wiki/"女"],["男")表示

factor_name : string
    变量名

flag_name : string,(default="label")
    标签列列名

type : string,(default="df")
    df时返回展开型的分bin
    dict时返回dict型的分bin

not_in_list : list,(default=["None", "NaN", "NA", "nan",None, "-999", "-999.0", -999,"-1111","-1111.0",-1111])
    空值列表,在列表中的值会被认为空值

Return
------
output : 一个pandas dataframe 包括了特征的变量名,以及相关信息
"""