大数据技术资料收集 - xingzhihe/hello-world GitHub Wiki
生态及其技术栈
七张图全面了解大数据生态圈 大数据生态及其技术栈 大数据概述及其生态圈(一) 大数据概述及其生态圈(二)基础架构支持 大数据概述及其生态圈(三)数据采集 董老师开讲了:系列一之大数据入门
平台及容器
拉开大变革序幕(上):在浪潮之巅观望Docker 拉开大变革序幕(中):Docker 场景化尝试 拉开大变革序幕(下):分布式计算框架与大数据 IaaS vs CaaS vs PaaS vs FaaS:选择正确的平台 CentOS6下docker的安装和使用
Machine Learning
CNN on TensorFlow Text Classification with CNN and RNN Fine-tuning Convolutional Neural Network on own data using Keras Tensorflow
OCR
Tesseract训练中文字体识别 Java OCR 图像智能字符识别技术,可识别中文
Spark
spark.apache.org Spark系列 litaotao.github.io Spark RDDs Simplified 数据处理平台架构中的SMACK组合:Spark、Mesos、Akka、Cassandra以及Kafka 使用 Apache Spark 让 MySQL 查询速度提升 10 倍以上 streamingpro
Scala
菜鸟教程 scala Learn X in Y minutes Scala Learn X in Y minutes Scala cn
Others
并发编程 sqoop2:从mysql导出数据到hdfs 基于 Spring Cloud 的微服务架构 史上最简单的 SpringCloud 教程