close
Warning:
Can't synchronize with repository "(default)" (Unsupported version control system "svn": libserf-1.so.1: failed to map segment from shared object: Cannot allocate memory). Look in the Trac log for more information.
- Timestamp:
-
Sep 28, 2010, 10:01:29 AM (15 years ago)
- Author:
-
waue
- Comment:
-
--
Legend:
- Unmodified
- Added
- Removed
- Modified
-
|
v1
|
v2
|
|
| 10 | 10 | [wiki:NCHCCloudCourse100928_4_EXM3 上一關 < ] 第四關 [wiki:NCHCCloudCourse100928_4_EXM5 > 下一關] |
| 11 | 11 | |
| | 12 | = 說明 = |
| | 13 | {{{ |
| | 14 | #!text |
| | 15 | WordCount |
| | 16 | 說明: |
| | 17 | 用於字數統計 |
| | 18 | |
| | 19 | 測試方法: |
| | 20 | 將此程式運作在hadoop 0.20 平台上,執行: |
| | 21 | --------------------------- |
| | 22 | hadoop jar WordCount.jar <input> <output> |
| | 23 | --------------------------- |
| | 24 | |
| | 25 | 注意: |
| | 26 | 1. 在hdfs 上來源檔案的路徑為 你所指定的 <input> |
| | 27 | 請注意必須先放資料到此hdfs上的資料夾內,且此資料夾內只能放檔案,不可再放資料夾 |
| | 28 | 2. 運算完後,程式將執行結果放在hdfs 的輸出路徑為 你所指定的 <output> |
| | 29 | |
| | 30 | }}} |
| | 31 | |
| | 32 | = !WordCount.java = |
| 12 | 33 | |
| 13 | 34 | {{{ |
| … |
… |
|
| 27 | 48 | import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; |
| 28 | 49 | import org.apache.hadoop.util.GenericOptionsParser; |
| 29 | | //WordCount |
| 30 | | //說明: |
| 31 | | // 用於字數統計 |
| 32 | | // |
| 33 | | //測試方法: |
| 34 | | // 將此程式運作在hadoop 0.20 平台上,執行: |
| 35 | | // --------------------------- |
| 36 | | // hadoop jar WordCount.jar <input> <output> |
| 37 | | // --------------------------- |
| 38 | | // |
| 39 | | //注意: |
| 40 | | //1. 在hdfs 上來源檔案的路徑為 你所指定的 <input> |
| 41 | | //請注意必須先放資料到此hdfs上的資料夾內,且此資料夾內只能放檔案,不可再放資料夾 |
| 42 | | //2. 運算完後,程式將執行結果放在hdfs 的輸出路徑為 你所指定的 <output> |
| 43 | | // |
| | 50 | |
| 44 | 51 | public class WordCount { |
| 45 | 52 | |