|   | 1 | {{{ | 
                  
                          |   | 2 | #!html | 
                  
                          |   | 3 | <div style="text-align: center;"><big | 
                  
                          |   | 4 |  style="font-weight: bold;"><big><big>雲端運算之大量資料處理、分析與應用</big></big></big></div> | 
                  
                          |   | 5 | }}} | 
                  
                          |   | 6 | [[PageOutline]] | 
                  
                          |   | 7 |  | 
                  
                          |   | 8 | = 報名資訊 = | 
                  
                          |   | 9 |  | 
                  
                          |   | 10 |  * 詳[http://www.iiiedu.org.tw/ites/CBD.htm 資策會網站公告] | 
                  
                          |   | 11 |  | 
                  
                          |   | 12 | = 課程源起 = | 
                  
                          |   | 13 | {{{ | 
                  
                          |   | 14 | #!text | 
                  
                          |   | 15 |   雲端運算掀起了新一代的資訊革命,也帶來了資訊爆炸式的成長,根據最新IDC研究報告指出: | 
                  
                          |   | 16 | 2010年全球資料量將進入ZB(zettabytes,1 ZB 為1兆GB)時代,並且每年以60%的速度攀升, | 
                  
                          |   | 17 | 這意味著每18個月全球的資料量將翻倍。面對不斷擴張的驚人資料量,大量資料的儲存、管理、處理 | 
                  
                          |   | 18 | 、搜尋、分析與智能應用等處理資料的能力將面臨新的挑戰,處理資料技術也迫切需要可動態與彈性 | 
                  
                          |   | 19 | 的特點,以支援大量資料處理的計算模式。 | 
                  
                          |   | 20 |  | 
                  
                          |   | 21 |   雲端運算使得分散式運算技術成了新顯學,整合MapReduce演算法並被各大企業所廣泛採用的 | 
                  
                          |   | 22 | Hadoop套件,更是開發雲端運算技術的佼佼者,它是用來處理與保存大量資料的雲端運算平台。 | 
                  
                          |   | 23 | 全球各大IT企業(如:雅虎、IBM等)無不積極投資與推廣此一計算模式,並被作為雲端運算環境中 | 
                  
                          |   | 24 | 的重要基礎軟件。有了Hadoop軟體平台後,始可進行各項分析,如:電信業者如今可以分析手機在 | 
                  
                          |   | 25 | 基地台漫遊的特性,提供更好的在地費率;信用卡業者如今可以每天定期分析各種信用貸款所產生的 | 
                  
                          |   | 26 | 風險,動態調整信貸利率;便利超商如今可以分析消費者的購買習慣,動態調整架上存貨數量;甚至 | 
                  
                          |   | 27 | 新興產業,如生醫資訊、智慧電網等皆可運用Hadoop平台來進行資料探勘與趨勢預測。若您的企業 | 
                  
                          |   | 28 | 有儲存海量資料的需求,有分析海量資料的需求,或者面臨資料庫過度龐大,正在尋求分散式資料庫 | 
                  
                          |   | 29 | 或資料倉儲的技術,那Hadoop或許是一個已通過商業驗證的選擇。只要懂得駕馭Hadoop這隻大象, | 
                  
                          |   | 30 | 它將能駝著您爬過一座座資料大山,幫您理出隱藏在群眾中的邏輯。 | 
                  
                          |   | 31 | }}} | 
                  
                          |   | 32 |  | 
                  
                          |   | 33 | = 課程目標 = | 
                  
                          |   | 34 | {{{ | 
                  
                          |   | 35 | #!text | 
                  
                          |   | 36 | 學習雲端運算之三大關鍵技術,及利用Hadoop之分散式檔案系統(HDFS)與MapReduce,快速建構 | 
                  
                          |   | 37 | 出雲端運算的執行環境和服務,並以實作方式讓學員了解如何透過Hadoop架構以進行雲端資料的大量 | 
                  
                          |   | 38 | 資料處理、分析與應用。 | 
                  
                          |   | 39 | }}} | 
                  
                          |   | 40 | = 課程特色 = | 
                  
                          |   | 41 |  | 
                  
                          |   | 42 |  * 本課程屬於基礎觀念課程,不特別講解程式設計; | 
                  
                          |   | 43 |  * 實作將採體驗式教學,亦即先透過指令剪貼方式,體驗一次操作,從體驗中驗證所學觀念。 | 
                  
                          |   | 44 |  | 
                  
                          |   | 45 | = 適合對象 = | 
                  
                          |   | 46 |  | 
                  
                          |   | 47 |  * IT經理或系統網路部門主管 | 
                  
                          |   | 48 |  * 專案經理、系統架構師或系統網路管理人員 | 
                  
                          |   | 49 |  * 企業或技術決策人員 | 
                  
                          |   | 50 |  * 對於私有雲端運算有興趣的人士 | 
                  
                          |   | 51 |  | 
                  
                          |   | 52 | = 預備知識 = | 
                  
                          |   | 53 |  | 
                  
                          |   | 54 |  * 具 Linux 操作實務與 Java 程式語言基礎者尤佳。 | 
                  
                          |   | 55 |  | 
                  
                          |   | 56 | = 課程日期 = | 
                  
                          |   | 57 |  | 
                  
                          |   | 58 |  * 101年05月26日~05月27日 ( 週六日白天9:00 ~17:00 ),共2天、計14小時 。 | 
                  
                          |   | 59 |  | 
                  
                          |   | 60 | = 上課地點 = | 
                  
                          |   | 61 |  | 
                  
                          |   | 62 |  * 資策會數位教育研究所,台北市復興南路一段 390 號 2 樓 201 教室。 | 
                  
                          |   | 63 |  * 位於捷運木柵線大安站斜對面(復興南路與信義路交叉口),台灣企銀樓上。 | 
                  
                          |   | 64 |  * 上課地點與教室之確認,以上課通知函為主。 | 
                  
                          |   | 65 |  | 
                  
                          |   | 66 | = 課程內容 = | 
                  
                          |   | 67 |  | 
                  
                          |   | 68 |  * [raw-attachment:wiki:III120526:12-05-26_Big_Data_and_Hadoop.pdf 完整版投影片] | 
                  
                          |   | 69 |  | 
                  
                          |   | 70 | == '''2012-05-26(六)''' == | 
                  
                          |   | 71 |  | 
                  
                          |   | 72 |  || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || | 
                  
                          |   | 73 |  || 09:00~10:00 || 淺談海量資料的趨勢、挑戰與因應對策 || [raw-attachment:wiki:III120526:part-1.pdf part-1] || || || | 
                  
                          |   | 74 |  || 10:00~11:00 || 處理海量資料的資訊架構與關鍵技術 || [raw-attachment:wiki:III120526:part-2.pdf part-2] || || || | 
                  
                          |   | 75 |  || 11:00~11:10 || 中場休息 || || || || | 
                  
                          |   | 76 |  || 11:10~11:30 || 實作一:Hadoop 單機安裝 || || [wiki:III120526/Lab1 實作一][[BR]][wiki:III120526/Lab2 實作二] || || | 
                  
                          |   | 77 |  || 11:30~12:00 || Hadoop 簡介:緣起與術語 || [raw-attachment:wiki:III120526:part-3.pdf part-3] || || || | 
                  
                          |   | 78 |  || 12:00~13:30 || 午餐、午休 || || || || | 
                  
                          |   | 79 |  || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || | 
                  
                          |   | 80 |  || 13:30~14:50 || HDFS 觀念與指令解說 || [raw-attachment:wiki:III120526:part-4.pdf part-4] || || || | 
                  
                          |   | 81 |  || 14:50~15:10 || 實作二:HDFS 操作實務 || || [wiki:III120526/Lab3 實作三][[BR]][wiki:III120526/Lab4 實作四] || || | 
                  
                          |   | 82 |  || 15:10~15:20 || 中場休息 || || || || | 
                  
                          |   | 83 |  || 15:20~16:00 || MapReduce 簡介 || [raw-attachment:wiki:III120526:part-5.pdf part-5] || || || | 
                  
                          |   | 84 |  || 16:00~16:30 || 實作三:MapReduce 範例操作 || || [wiki:III120526/Lab5 實作五][[BR]][wiki:III120526/Lab6 實作六] || || | 
                  
                          |   | 85 |  || 16:30~17:00 || 今日課程回顧與問題討論 || || || || | 
                  
                          |   | 86 |  | 
                  
                          |   | 87 | == '''2012-05-26(日)''' == | 
                  
                          |   | 88 |  | 
                  
                          |   | 89 |  || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || | 
                  
                          |   | 90 |  || 09:00~10:00 || Hadoop 叢集安裝設定解說 || [raw-attachment:wiki:III120211:part-5.pdf part-5] || || || | 
                  
                          |   | 91 |  || 10:00~10:30 || 實作四:Hadoop 程式編譯實務 || || [wiki:III120211/Lab7 實作七][[BR]][wiki:III120211/Lab8 實作八] || ||  | 
                  
                          |   | 92 |  || 10:30~10:40 || 中場休息 || || || || | 
                  
                          |   | 93 |  || 10:40~11:10 || Hadoop 相關專案(1) Hadoop Streaming || [raw-attachment:wiki:III120211:part-6.pdf part-6] || || || | 
                  
                          |   | 94 |  || 11:10~12:00 || 實作五:Hadoop Streaming 操作練習 || || [wiki:III120211/Lab9 實作九][[BR]][wiki:III120211/Lab10 實作十] || || | 
                  
                          |   | 95 |  || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || | 
                  
                          |   | 96 |  || 13:30~14:50 || Hadoop 相關專案(2) - Pig || [raw-attachment:wiki:III120211:part-7.pdf part-7] || || || | 
                  
                          |   | 97 |  || 14:50~15:10 || 實作六:Pig Latin 操作練習 || || [wiki:III120211/Lab11 實作十一] || || | 
                  
                          |   | 98 |  || 15:10~15:20 || 中場休息 || || || || | 
                  
                          |   | 99 |  || 15:20~16:00 || Hadoop 示範應用 - 抓抓龍(Crawlzilla) || [raw-attachment:wiki:III120211:part-8.pdf part-8] || || || | 
                  
                          |   | 100 |  || 16:00~16:30 || 實作七:抓抓龍安裝操作(示範) || || [wiki:III120211/Lab12 實作十二] || || | 
                  
                          |   | 101 |  || 16:30~17:00 || 今日課程回顧與問題討論 || || || || | 
                  
                          |   | 102 |  ||  補充 || Hadoop 示範應用 - 雲端入侵日誌分析系統(ICAS) || [raw-attachment:wiki:III120211:part-9.pdf part-9] || [http://icas.classcloud.org 示範網站] || || | 
                  
                          |   | 103 |  | 
                  
                          |   | 104 | = 參考資料 = | 
                  
                          |   | 105 |  | 
                  
                          |   | 106 |  * Hadoop 常見應用領域: | 
                  
                          |   | 107 |    * [http://www-304.ibm.com/easyaccess/fileserve?contentid=217007 Data Intensive Analytics with Hadoop: A Look Inside] | 
                  
                          |   | 108 |    * 商業智慧 | 
                  
                          |   | 109 |      * http://www.pentaho.com/ - Pentaho 這間 BI 公司是 Hadoop 技術的長期支持者 | 
                  
                          |   | 110 |    * 金融業 | 
                  
                          |   | 111 |      * 2010-10-12 : VISA 採用 Hadoop 做風險評估 - [http://www.slideshare.net/cloudera/hw09-large-scale-transaction-analysis HadoopWorld 2009 : Large Scale Transaction Analysis] | 
                  
                          |   | 112 |      * 中國信託 | 
                  
                          |   | 113 |    * 電信業 | 
                  
                          |   | 114 |      * 2011-06-12 : [http://www.ithome.com.tw/itadm/article.php?c=68023 中華電信用Hadoop技術分析通話明細] | 
                  
                          |   | 115 |    * 人力資源 | 
                  
                          |   | 116 |      * [http://www.simplyhired.com/a/jobtrends/trend/q-xen%2C+hyper-v%2C+hbase%2C+hadoop SimplyHired 就業技能調查排行榜] | 
                  
                          |   | 117 |      * [http://www.indeed.com/jobtrends?q=xen%2C+hyper-v%2C+hbase%2C+hadoop&l= Indeed 就業技能調查排行榜] | 
                  
                          |   | 118 |    * 行銷趨勢 | 
                  
                          |   | 119 |      * [http://www.eland.com.tw/solutions/opview_insight 意藍科技 雲端服務 OpView 品牌口碑雷達] - ([http://www.eland.com.tw/news/news/20100506 2010-05-06]) | 
                  
                          |   | 120 |      * [http://www.i-buzz.com.tw/index.asp i-Buzz網路口碑研究中心] | 
                  
                          |   | 121 |    * 科學教育 | 
                  
                          |   | 122 |      * 生資  | 
                  
                          |   | 123 |        * [http://www.slideshare.net/mndoci/hadoop-for-bioinformatics Hadoop for Bioinformatics] | 
                  
                          |   | 124 |        * [http://cloudcomputing.sys-con.com/node/1869333 The Future of Hadoop in Bioinformatics] | 
                  
                          |   | 125 |        * [http://abhishek-tiwari.com/2010/08/mapreduce-and-hadoop-algorithms-in-bioinformatics-papers.html Mapreduce and Hadoop Algorithms in Bioinformatics Papers] | 
                  
                          |   | 126 |      * 統計  | 
                  
                          |   | 127 |        * [https://mpi-inf.mpg.de/~rgemulla/publications/das10ricardo.pdf Ricardo: Integrating R and Hadoop] | 
                  
                          |   | 128 |        * [http://ml.stat.purdue.edu/rhipe/ RHIPE: R and Hadoop Integrated Programming Environment] | 
                  
                          |   | 129 |  | 
                  
                          |   | 130 |  * 免費課程 - 把類似今天的課程再聽一次 | 
                  
                          |   | 131 |    * http://www.classcloud.org/media | 
                  
                          |   | 132 |  * Hadoop 進階程式設計相關資訊 | 
                  
                          |   | 133 |    * [http://trac.nchc.org.tw/cloud/wiki/NCHCCloudCourse110721 雲端運算進階課程(一)@ 新竹 - Hadoop 進階程式設計與 HBase 資料庫整合實作] | 
                  
                          |   | 134 |    * [http://trac.nchc.org.tw/cloud/wiki/NCHCCloudCourse100928_2_IDE 編譯環境設定- 安裝 Eclipse 3.3.2 與 Hadoop 外掛程式] | 
                  
                          |   | 135 |    * [http://trac.nchc.org.tw/cloud/wiki/NCHCCloudCourse100928/Netbeans 安裝 Netbean 6.9.1 中文版與 KamaSphere Studio 外掛程式] | 
                  
                          |   | 136 |  | 
                  
                          |   | 137 | = 課後練習 =  | 
                  
                          |   | 138 |  | 
                  
                          |   | 139 |  * 使用[http://trac.nchc.org.tw/cloud/wiki/Hadoop4Win Hadoop4Win] - 在 Windows 上安裝單機版 Hadoop 與 HBase 練習環境 ('''注意:僅供練習使用,請勿用於實際營運!''') | 
                  
                          |   | 140 |  * 使用 HBase 0.90 改寫以上範例 [http://trac.nchc.org.tw/cloud/wiki/waue/2011/0426  code example ] | 
                  
                          |   | 141 |  * [http://sourceforge.net/projects/drbl-hadoop/files/ DRBL-Hadoop Live CD] (CDH2, 0.20.x) - 國網中心 hadoop.nchc.org.tw 的底層作法,使用方法仍在整理中~但已足夠作為練習 Hadoop 的執行環境 | 
                  
                          |   | 142 |  * 使用[http://www.cloudera.com/downloads/ Cloudera 提供的 VMWare Image] (CDH2, 0.20.x) | 
                  
                          |   | 143 |  * 使用[http://developer.yahoo.com/hadoop/tutorial/module3.html#vm Yahoo! Hadoop Tutorial 的 VMWare Image] (0.20.S) | 
                  
                          |   | 144 |  * 使用[http://code.google.com/intl/zh-TW/edu/parallel/tools/hadoopvm/index.html Google 提供的 Hadoop VMWare Image] (0.13,很舊了) | 
                  
                          |   | 145 |  | 
                  
                          |   | 146 | = 公用環境 = | 
                  
                          |   | 147 |  | 
                  
                          |   | 148 |  * 課後問題討論,建議優先至台灣 Hadoop 使用者討論區 http://forum.hadoop.tw 進行討論。 | 
                  
                          |   | 149 |  * 需要 Hadoop 叢集環境,可至 http://hadoop.nchc.org.tw 申請帳號。 | 
                  
                          |   | 150 |    * 申請步驟,請參閱[wiki:YMU110509/Lab1 截圖說明] | 
                  
                          |   | 151 |  * 關於公用叢集的幾個重要入口: | 
                  
                          |   | 152 |  * http://hadoop.nchc.org.tw - 實驗叢集入口網站 | 
                  
                          |   | 153 |  * http://hadoop.nchc.org.tw/ganglia - 實驗叢集負載狀態 | 
                  
                          |   | 154 |  * http://hadoop.nchc.org.tw:50030 - 實驗叢集正在執行與執行完畢的任務 | 
                  
                          |   | 155 |  * http://hadoop.nchc.org.tw:50070 - 實驗叢集的硬碟空間狀態 | 
                  
                          |   | 156 |  * http://hadoop.nchc.org.tw/hadoop-doc - Hadoop 相關說明文件 | 
                  
                          |   | 157 |  * http://hadoop.nchc.org.tw/hadoop-doc/api/index.html - Hadoop 0.20.2 javadoc 文件 | 
                  
                          |   | 158 |  | 
                  
                          |   | 159 | = 輔助工具 = | 
                  
                          |   | 160 |  | 
                  
                          |   | 161 |  * [http://portableapps.com/apps/internet/firefox_portable/localization Firefox Portable (繁體中文版)] | 
                  
                          |   | 162 |  * [http://azo-freeware.blogspot.com/2009/08/zoomit-40.html ZoomIt (簡報放大鏡)] |