阿里(蚂蚁金服) 一面 - 841182743/- GitHub Wiki
1.找一个认为做的比较好的项目(10分钟)
2.树的集成分为哪些类型呢?xgboost是集成了哪一种?
3.xgboost与gbdt对比,优势与不同?xgboost一般基于哪种树?
4.GBDT主要是用哪一种的?
5.xgboost的代价函数上有什么区别?
6.网格搜索,逻辑等在哪里实现的?用什么语言?python一般用哪些包?
7.除了xgboost你还有python实现哪些算法?
8.说下逻辑回归和线性回归的区别?计算最优解的过程中他们的区别是什么?
9.怎么处理(或者预防)过拟合这种情况?
10.交叉验证一般用几折?样本量是多大?(答得不好), 处理后的结果表现是怎么样的?不同的fold(折)里面差别是多大(模型表现的波动性是多大)?
11.k折交叉验证怎么去衡量模型的结果?
12.bagging和boosting的区别?(答得不好)xgboost和GBDT都是基于哪一种?随机森林呢?
13.隐马尔科夫模型和高斯模型是不是实现的?介绍下隐马尔科夫的基本三要素。其中的时间序列具体指的是?具体的实现逻辑?为什么选择这个模型?有考虑其他的时序模型吗? 最终的效果怎么样?
14.有什么问题想问我么? 评价:对自己做的项目还是比较了解,不同算法之间的对比、不同方法之间的异同、知识覆盖面不行 如果过了三天之内有答复
15.其他时序模型有了解吗?