动手之前 - leetschau/Python-Machine-Learning-Cookbook GitHub Wiki

开发环境准备

安装Anaconda:

Windows的自带命令行工具很菜,对后续学习形成阻碍,建议安装Chocolatey,之后可以使用choco install anaconda3安装Anaconda,使用choco install cmder安装命令行工具cmder

Anaconda自带了本教程需要的Python及机器学习库,cmder自带了git等一些有用的工具。

Anaconda体积较大,请在网络畅通的地方下载或者安装。

Linux系统:从Anaconda下载页下载安装文件安装。

本课程用到的库:

  • numpy: 高性能数值计算的数据结构array及其基本操作,部分数值计算工具;
  • scipy: 基础数值计算包;
  • pandas: 基于numpy,提供了对数据表(table,dataframe/dataset for Spark)的高级操作;
  • scikit-learn: 机器学习工具集;
  • matplotlib: 绘图工具集;

Python语言基础

Python语言十分钟快速入门

Git基础知识

  • 什么是版本控制
  • 什么是commit(提交)
  • 如何查看所有提交历史
  • 如何查看某个提交的具体内容

参考:Git是版本控制和代码交流工具,参考Git简明指南

作业:

  • 按照chocolatey,并用它安装anaconda,如果已经安装了Python, spyder, anaconda,请卸载 :)
  • Fork本仓库,创建一个自己名字命名的文件夹,完成一个简单的Python算法程序,放在文件夹里,给我发PR。
  • 尝试安装miniconda,搞清楚anaconda和miniconda有什么区别,告诉我你的答案。