LogisticsCard.bagging - shuiwanghuohuo/scorecard_wiki GitHub Wiki
LogisticsCard.bagging(self, x, y, filter_evidence, iter_num, sample_num, bad_rate=0.1,
method="newton-cg", test_size=0.4, p_value=0.05, class_weight=None)
利用bagging训练模型,主要在黑样本浓度较小时使用,目前只支持对白样本重复采样
Parameter Description
---------------------
x : pandas.core.frame.DataFrame
评分卡构建时所需要的指标woe数据
y : pandas.core.frame.DataFrame
标签信息
filter_evidence : pandas.core.frame.DataFrame
feature_select函数产生的结果
iter_num : int
训练次数
sample_num : int
每次训练的样本数
bad_rate : float,(default=0.1)
每次训练的坏样本比例
p_value : float,(default=0.05)
p_value阈值,小于等于阈值时变量可以被接受
method : string,(default="newton-cg")
训练方法,不同底层时命名会有所不同,与底层逻辑回归训练方法完全对应
方法详细说明参考scorecard.Logistics函数
class_weight : dict or "balanced", (default = None)
类别权重,类别不平衡时使用
方法详细说明参考scorecard.Logistics函数
Return
------
scorecard_info:pandas.core.frame.DataFrame
训练好的评分卡信息