trans.py - shuiwanghuohuo/scorecard_wiki GitHub Wiki
trans_rdd(data, black_flag="label", data_type="map", update_col=[])
将指标计算代码产出的dataframe转换为可用rdd,为筛选指标做准备
Parameter Description
---------------------
data : spark dataframe
指标计算代码产出的dataframe
black_flag : string,(default="label")
标签列列名
data_type : string,(default="map")
数据格式,默认为"map",表示数据集中有map格式,可接受"flat",表示数据为宽表格式
update_col : list,(default=[])
额外需要保留的列,只在data_type为"map"时生效
Return
------
data_rdd : 转换后的rdd