close
Warning:
Can't synchronize with repository "(default)" (Unsupported version control system "svn": /usr/lib/python2.7/dist-packages/libsvn/_fs.so: failed to map segment from shared object: Cannot allocate memory). Look in the Trac log for more information.
- Timestamp:
-
Sep 28, 2010, 10:01:29 AM (15 years ago)
- Author:
-
waue
- Comment:
-
--
Legend:
- Unmodified
- Added
- Removed
- Modified
-
v1
|
v2
|
|
10 | 10 | [wiki:NCHCCloudCourse100928_4_EXM3 上一關 < ] 第四關 [wiki:NCHCCloudCourse100928_4_EXM5 > 下一關] |
11 | 11 | |
| 12 | = 說明 = |
| 13 | {{{ |
| 14 | #!text |
| 15 | WordCount |
| 16 | 說明: |
| 17 | 用於字數統計 |
| 18 | |
| 19 | 測試方法: |
| 20 | 將此程式運作在hadoop 0.20 平台上,執行: |
| 21 | --------------------------- |
| 22 | hadoop jar WordCount.jar <input> <output> |
| 23 | --------------------------- |
| 24 | |
| 25 | 注意: |
| 26 | 1. 在hdfs 上來源檔案的路徑為 你所指定的 <input> |
| 27 | 請注意必須先放資料到此hdfs上的資料夾內,且此資料夾內只能放檔案,不可再放資料夾 |
| 28 | 2. 運算完後,程式將執行結果放在hdfs 的輸出路徑為 你所指定的 <output> |
| 29 | |
| 30 | }}} |
| 31 | |
| 32 | = !WordCount.java = |
12 | 33 | |
13 | 34 | {{{ |
… |
… |
|
27 | 48 | import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; |
28 | 49 | import org.apache.hadoop.util.GenericOptionsParser; |
29 | | //WordCount |
30 | | //說明: |
31 | | // 用於字數統計 |
32 | | // |
33 | | //測試方法: |
34 | | // 將此程式運作在hadoop 0.20 平台上,執行: |
35 | | // --------------------------- |
36 | | // hadoop jar WordCount.jar <input> <output> |
37 | | // --------------------------- |
38 | | // |
39 | | //注意: |
40 | | //1. 在hdfs 上來源檔案的路徑為 你所指定的 <input> |
41 | | //請注意必須先放資料到此hdfs上的資料夾內,且此資料夾內只能放檔案,不可再放資料夾 |
42 | | //2. 運算完後,程式將執行結果放在hdfs 的輸出路徑為 你所指定的 <output> |
43 | | // |
| 50 | |
44 | 51 | public class WordCount { |
45 | 52 | |