大数据技术资料收集 - xingzhihe/hello-world GitHub Wiki

生态及其技术栈

七张图全面了解大数据生态圈 大数据生态及其技术栈 大数据概述及其生态圈(一) 大数据概述及其生态圈(二)基础架构支持 大数据概述及其生态圈(三)数据采集 董老师开讲了:系列一之大数据入门

平台及容器

拉开大变革序幕(上):在浪潮之巅观望Docker 拉开大变革序幕(中):Docker 场景化尝试 拉开大变革序幕(下):分布式计算框架与大数据 IaaS vs CaaS vs PaaS vs FaaS:选择正确的平台 CentOS6下docker的安装和使用

Machine Learning

CNN on TensorFlow Text Classification with CNN and RNN Fine-tuning Convolutional Neural Network on own data using Keras Tensorflow

OCR

Tesseract训练中文字体识别 Java OCR 图像智能字符识别技术,可识别中文

Spark

spark.apache.org Spark系列 litaotao.github.io Spark RDDs Simplified 数据处理平台架构中的SMACK组合:Spark、Mesos、Akka、Cassandra以及Kafka 使用 Apache Spark 让 MySQL 查询速度提升 10 倍以上 streamingpro

Scala

菜鸟教程 scala Learn X in Y minutes Scala Learn X in Y minutes Scala cn

Others

并发编程 sqoop2:从mysql导出数据到hdfs 基于 Spring Cloud 的微服务架构 史上最简单的 SpringCloud 教程

Autoit

autoit 在线手册中文版_脚本之家 FAQ - AutoIt Wiki