LogisticsCard.bagging - shuiwanghuohuo/scorecard_wiki GitHub Wiki

LogisticsCard.bagging(self, x, y, filter_evidence, iter_num, sample_num, bad_rate=0.1, 
                  method="newton-cg", test_size=0.4, p_value=0.05, class_weight=None)

利用bagging训练模型,主要在黑样本浓度较小时使用,目前只支持对白样本重复采样

    Parameter Description
    ---------------------
    x : pandas.core.frame.DataFrame
        评分卡构建时所需要的指标woe数据

    y : pandas.core.frame.DataFrame
        标签信息

    filter_evidence : pandas.core.frame.DataFrame
        feature_select函数产生的结果

    iter_num : int
        训练次数

    sample_num : int
        每次训练的样本数

    bad_rate : float,(default=0.1)
        每次训练的坏样本比例

    p_value : float,(default=0.05)
        p_value阈值,小于等于阈值时变量可以被接受

    method : string,(default="newton-cg")
        训练方法,不同底层时命名会有所不同,与底层逻辑回归训练方法完全对应
        方法详细说明参考scorecard.Logistics函数

    class_weight : dict or "balanced", (default = None)
        类别权重,类别不平衡时使用
        方法详细说明参考scorecard.Logistics函数

    Return
    ------
    scorecard_info:pandas.core.frame.DataFrame
        训练好的评分卡信息