动手之前 - leetschau/Python-Machine-Learning-Cookbook GitHub Wiki
开发环境准备
安装Anaconda:
Windows的自带命令行工具很菜,对后续学习形成阻碍,建议安装Chocolatey,之后可以使用choco install anaconda3安装Anaconda,使用choco install cmder安装命令行工具cmder。
Anaconda自带了本教程需要的Python及机器学习库,cmder自带了git等一些有用的工具。
Anaconda体积较大,请在网络畅通的地方下载或者安装。
Linux系统:从Anaconda下载页下载安装文件安装。
本课程用到的库:
- numpy: 高性能数值计算的数据结构array及其基本操作,部分数值计算工具;
- scipy: 基础数值计算包;
- pandas: 基于numpy,提供了对数据表(table,dataframe/dataset for Spark)的高级操作;
- scikit-learn: 机器学习工具集;
- matplotlib: 绘图工具集;
Python语言基础
Git基础知识
- 什么是版本控制
- 什么是commit(提交)
- 如何查看所有提交历史
- 如何查看某个提交的具体内容
作业:
- 按照chocolatey,并用它安装anaconda,如果已经安装了Python, spyder, anaconda,请卸载 :)
- Fork本仓库,创建一个自己名字命名的文件夹,完成一个简单的Python算法程序,放在文件夹里,给我发PR。
- 尝试安装miniconda,搞清楚anaconda和miniconda有什么区别,告诉我你的答案。