HiveRefer - huangyuefeng/study GitHub Wiki
Hive的学习材料还是少,也就一书一文档, 蜜蜂书很精炼,但是基本不解释底层机制,容易知其然不知其所以然。 大概卡普廖洛 (Edward Capriolo)大牛觉得都很容易吧。
参考书籍:《Hive编程指南》
Hive--官方参考文档:
1.用户手册
https://cwiki.apache.org/confluence/display/Hive/Home#Home-UserDocumentation 喜欢里面的File Formats and Compression章节,管理大量数据是少不了要看了。
2.管理员手册
https://cwiki.apache.org/confluence/display/Hive/Home#Home-AdministrationDocumentation
里面的Metastore章节也是干货满满的。
3.设计文档 反正大神们已经做好的部分就没我们什么事了,还有Proposed可以看看,当然,没有投票权啦。
https://cwiki.apache.org/confluence/display/Hive/DesignDocs#DesignDocs-Completed
喜欢Join优化内容的:
https://cwiki.apache.org/confluence/display/Hive/MapJoinOptimization
https://cwiki.apache.org/confluence/display/Hive/Skewed+Join+Optimization
4.DDL操作:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL
5.DML操作:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML
6.数据查询
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select
7.函数清单
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF
8.蜜蜂书的姐妹版
https://github.com/mattbornski/Hive-Demo/tree/master/exercises 亚马逊和Hive大牛,wampler合作的一份教程。万普勒也是hive编程指南的作者。
9.最后给个中文的教程吧
http://gitbook.net/hive/index.html
没错,绝世武功就是动不动就要练个300年才能有所成的。