Changes between Version 10 and Version 11 of MR_manual
- Timestamp:
- Jun 13, 2008, 3:49:39 PM (17 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
MR_manual
v10 v11 15 15 然而大規模分散式運算技術即為「雲端運算」的概念起源,未來如手機、GPS等行動裝置都可以透過雲端運算技術,發展出更多的應用服務。 16 16 進一步的雲端運算不僅只做資料搜尋、分析的功能,未來如分析DNA結構、基因圖譜定序、解析癌症細胞等,都可以透過這項技術輕易達成。 17 [http://zh.wikipedia.org/wiki/%E9%9B%B2%E7%AB%AF%E9%81%8B%E7%AE%97 adapted by wikipedia]17 [http://zh.wikipedia.org/wiki/%E9%9B%B2%E7%AB%AF%E9%81%8B%E7%AE%97 copied by wikipedia] 18 18 === 1.3 Hadoop === 19 19 … … 29 29 MapReduce是Google 的一項重要技術,它是一個編程模型,用以進行大數據量的計算。對於大數據量的計算,通常採用的處理手法就是並行計算。至少現階段而言,對許多開發人員來說,並行計算還是一個比較遙遠的東西。MapReduce就是一種簡化並行計算的編程模型,它讓那些沒有多少並行計算經驗的開發人員也可以開發並行應用。[[BR]] 30 30 MapReduce的名字源於這個模型中的兩項核心操作:Map和 Reduce。也許熟悉Functional Programming(函數式編程)的人見到這兩個詞會倍感親切。簡單的說來,Map是把一組數據一對一的映射為另外的一組數據,其映射的規則由一個函數來指定,比如對[1, 2, 3, 4]進行乘2的映射就變成了[2, 4, 6, 8]。Reduce是對一組數據進行歸約,這個歸約的規則由一個函數指定,比如對[1, 2, 3, 4]進行求和的歸約得到結果是10,而對它進行求積的歸約結果是24。 31 [http://www.cnblogs.com/wayne1017/archive/2007/03/18/668768.html adapted from Hadoop學習筆記一簡要介紹]31 [http://www.cnblogs.com/wayne1017/archive/2007/03/18/668768.html copied from Hadoop學習筆記一簡要介紹] 32 32 33 33 === 1.4 HBase === … … 38 38 寫操作是行鎖定的,你不能一次鎖定多行。所有對行的寫操作默認是原子的。[[BR]] 39 39 所有數據庫更新操作都有時間戳。HBase對每個數據單元,只存儲指定個數的最新版本。客戶端可以查詢「從某個時刻起的最新數據」,或者一次得到所有的數據版本。 40 [http://tech.ccidnet.com/art/5833/20080318/1393525_1.html adapted from 詳細講解HBase]40 [http://tech.ccidnet.com/art/5833/20080318/1393525_1.html copied from 詳細講解HBase] 41 41 == 二、環境設定 == 42 42 == 三、執行 ==