Changes between Version 23 and Version 24 of jazz/08-11-05
- Timestamp:
- Nov 5, 2008, 12:18:05 PM (17 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
jazz/08-11-05
v23 v24 38 38 throw new IOException("SUICIDE"); 39 39 }}} 40 41 40 * 因為 key 是 Text 型態,因此要設定 !OutputKeyClass 為 Text 42 41 {{{ … … 47 46 * 通常輸入跟輸出都是純文字格式,因此預設是 !TextInputFormat 跟 !TextOutputFormat 48 47 * 但如果輸入跟輸出是二進位格式,那就必須使用 !SequenceFileInputFormat 跟 !SequenceFileOutputFormat 當作 Map/Reduce 的 !KeyClass 48 * Input -> InputSplit -> RecordReader 49 * Hadoop 會將輸入切成很多塊 InputSplit, 但是可能會遇到要處理的資料在另一塊 InputSplit 的困擾 49 50 * [http://www.hadoop.tw/2008/09/php-hadoop.html 用 "單機" 跟 "PHP" 開發 Hadoop 程式] 50 51