spark基础编程实验报告 - GongRuqin/bigdata GitHub Wiki
使用java编程,才用了之前wordcount的思路用ik分词包进行中文分词。
利用老师给的java8代码进行了一定修改,调用分词函数,进行wordcount。
代码:
WordCount
测试集:采用project1的download_data部分数据,共含100个txt。
运行结果:
使用java编程,才用了之前wordcount的思路用ik分词包进行中文分词。
利用老师给的java8代码进行了一定修改,调用分词函数,进行wordcount。
代码:
WordCount
测试集:采用project1的download_data部分数据,共含100个txt。
运行结果: