在Hadoop上執行MapReduce - twilighthook/BigDataNote GitHub Wiki

在上篇文章我們寫好了MapReduce的文章,且準備好了一份txt資料來執行 這篇就是要來實作在Hadoop下如何運用寫好的code


1. 配置資料hdfs上

首先你必須有一個Hadoop環境(單節點Hadoop建置教學),並將txt放置到hdfs上面

hadoop fs -mkdir /MapReduce /MapReduce/Input 
hadoop fs -put LasTempData.txt /MapReduce/Input

我們可以到console看一下檔案是否有配置上去

http://{your_ip}:9870/explorer.html#/<br>

這是Hadoop內建的console,提供了蠻多hdfs內的狀態

2. 執行MapReduce

接下來可以開始執行MapReduce了 (假如class在某個package之下要指定,EX : com.test.DoTempMapReduce)

hadoop jar DoTempMapReduce.jar DoTempMapReduce /MapReduce/Input/LasTempData.txt /MapReduce/Result

3. 執行完畢

執行完畢後,可以回到console發現MapReduce裡有新的Result 在裡面可以看到有兩個文檔,一個是success還有一個內容是

 2013	105
 2014	101
 2015	102
 2016	103
 2017	104
 2018	103
 2019	58

這就是我們主要要輸出的內容,歷年溫度的最高溫