20 | | || bin/hadoop || 呼叫使用hadoop程式 || 附註 || |
21 | | || jar contrib/streaming/hadoop-0.18.3-streaming.jar || 使用streaming這個功能 || 預設此jar檔放在 contrib/streaming/ 內 || |
22 | | || -input $INPUT || 設定hdfs上的輸入資料夾 || 需先上傳資料到hdfs 上 || |
23 | | || -output $OUTPUT || 設定hdfs上的輸出資料夾|| 注意在hdfs 上的 output資料夾不可重複|| |
24 | | || -mapper $MAPPER || 設定mapper程式 || 要給完整路徑 || |
25 | | || -reducer $REDUCER || 設定reducer程式 || 要給完整路徑 || |
| 20 | || bin/hadoop || 呼叫使用hadoop程式 || || |
| 21 | || jar contrib/streaming/hadoop-0.18.3-streaming.jar || 使用streaming這個功能 || ps:預設此jar檔放在 contrib/streaming/ 內 || |
| 22 | || -input $INPUT || 設定hdfs上的輸入資料夾 || ps:需先上傳資料到hdfs 上 || |
| 23 | || -output $OUTPUT || 設定hdfs上的輸出資料夾|| ps:在hdfs 上的 output資料夾不可重複|| |
| 24 | || -mapper $MAPPER || 設定mapper程式 || ps:要給完整路徑 || |
| 25 | || -reducer $REDUCER || 設定reducer程式 || ps:要給完整路徑 || |