HiveRefer - huangyuefeng/study GitHub Wiki

Hive的学习材料还是少,也就一书一文档, 蜜蜂书很精炼,但是基本不解释底层机制,容易知其然不知其所以然。 大概卡普廖洛 (Edward Capriolo)大牛觉得都很容易吧。

参考书籍:《Hive编程指南》

Hive--官方参考文档:

1.用户手册

https://cwiki.apache.org/confluence/display/Hive/Home#Home-UserDocumentation 喜欢里面的File Formats and Compression章节,管理大量数据是少不了要看了。

2.管理员手册

https://cwiki.apache.org/confluence/display/Hive/Home#Home-AdministrationDocumentation

里面的Metastore章节也是干货满满的。

3.设计文档 反正大神们已经做好的部分就没我们什么事了,还有Proposed可以看看,当然,没有投票权啦。

https://cwiki.apache.org/confluence/display/Hive/DesignDocs#DesignDocs-Completed

喜欢Join优化内容的:

https://cwiki.apache.org/confluence/display/Hive/MapJoinOptimization

https://cwiki.apache.org/confluence/display/Hive/Skewed+Join+Optimization

4.DDL操作:

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL

5.DML操作:

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DML

6.数据查询

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Select

7.函数清单

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF

8.蜜蜂书的姐妹版

https://github.com/mattbornski/Hive-Demo/tree/master/exercises 亚马逊和Hive大牛,wampler合作的一份教程。万普勒也是hive编程指南的作者。

9.最后给个中文的教程吧

http://gitbook.net/hive/index.html

没错,绝世武功就是动不动就要练个300年才能有所成的。