机器学习概述 - leetschau/Python-Machine-Learning-Cookbook GitHub Wiki
为什么要用机器学习
象棋程序的人类学习和机器学习实现思路对比。
为什么以前没有机器学习
- 目前处于大数据时代,到处都有成T成P的数据,简单规则处理难以发挥这些数据的价值;
- 廉价的高性能计算,使得基于大规模数据的学习时间和代价降低;
- 廉价的大规模存储,使得能够更快地和代价更小地处理大规模数据;
- 存在大量高价值的问题,使得花大量精力用机器学习解决问题后,能获得丰厚收益。
机器学习擅长解决什么问题
- 目标问题需要价值巨大,因为机器学习解决问题有一定的代价;
- 目标问题有大量数据可用,有大量数据才能使机器学习比较好地解决问题(相对于简单规则或人工);
- 目标问题由多种因素(特征)决定,机器学习解决问题的优势才能体现(相对于简单规则或人工);
- 目标问题需要持续优化,因为机器学习可以基于数据自我学习和迭代,持续地发挥价值。
参考:机器学习算法系列(39):实例详解机器学习如何解决问题
机器学习使用场景
- 预测房价:根据房子的户型、面积、地段、房龄等特征预测一套未标记房子的价格,监督学习,回归;
- 预测肿瘤良性/恶性:根据患者年龄、性别、既往病史、吸烟史、饮食习惯等预测肿瘤特性,监督学习,分类;
- 电影/新闻推荐:用户/内容聚类;
其他场景:垃圾邮件检测,预测信用卡欺诈,预测广告点击率,预测球队能否夺冠。