| 1 | {{{ |
| 2 | #!html |
| 3 | <div style="text-align: center;"><big |
| 4 | style="font-weight: bold;"><big><big>雲端運算之大量資料處理、分析與應用</big></big></big></div> |
| 5 | }}} |
| 6 | [[PageOutline]] |
| 7 | |
| 8 | = 課程日期 = |
| 9 | |
| 10 | * 2013-05-21 09:00-16:00 |
| 11 | * 2013-05-24 09:00-16:00 |
| 12 | * 共2天、計12小時 。 |
| 13 | |
| 14 | = 上課地點 = |
| 15 | |
| 16 | * 新竹縣竹東鎮中興路四段195號14館 012 室 |
| 17 | |
| 18 | = 課程內容 = |
| 19 | |
| 20 | * [raw-attachment:wiki:ITRI0521:13-03-16_Big_Data_and_Hadoop_Ecosystem.pdf 完整版投影片] |
| 21 | |
| 22 | == '''2013-03-16(六)''' == |
| 23 | |
| 24 | || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 25 | || 09:00~10:00 || 淺談海量資料的趨勢、挑戰與因應對策 || [raw-attachment:wiki:ITRI0521:part-1.pdf part-1] || || 1. [http://www.meetup.com/Taiwan-useR-Group Taiwan useR Group 聚會]|| |
| 26 | || 10:00~11:00 || 處理海量資料的資訊架構與關鍵技術 || [raw-attachment:wiki:ITRI0521:part-2.pdf part-2] || || || |
| 27 | || 11:00~11:10 || 中場休息 || || || || |
| 28 | || 11:10~12:00 || 實作一:Hadoop 單機安裝 || || [wiki:ITRI0521/Lab1 實作一][[BR]][wiki:ITRI0521/Lab2 實作二] || 1. [wiki:ITRI0521/Lab14 Linux 單機版安裝(on EasyCloud)] [[BR]] 2. [http://forum.hadoop.tw/viewtopic.php?p=40963#p40963 Hadoop 單機安裝(Ubuntu Linux)] || |
| 29 | || 12:00~13:00 || 午餐、午休 || || || || |
| 30 | || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 31 | || 13:00~14:20 || Hadoop 簡介:緣起與術語 || [raw-attachment:wiki:ITRI0521:part-3.pdf part-3] || || 1. [http://www.youtube.com/watch?v=N35HFV582Vw 行動拍拍樂 不到一秒 幫你迅速比價] [[BR]] 2. [http://www.appledaily.com.tw/appledaily/article//20090901/31906522/ 手機拍商品 5秒秀比價資訊] [[BR]] 3. [https://www.youtube.com/watch?v=WB9zr0IZCPQ Introduction to Apache Mahout]|| |
| 32 | || 14:20~15:30 || HDFS 觀念與指令解說 || [raw-attachment:wiki:ITRI0521:part-4.pdf part-4] || || || |
| 33 | || 15:30~15:40 || 中場休息 || || || || |
| 34 | || 15:40~17:00 || 實作二:HDFS 操作實務 || || [wiki:ITRI0521/Lab3 實作三][[BR]][wiki:ITRI0521/Lab4 實作四] || || |
| 35 | |
| 36 | == '''2013-03-17(日)''' == |
| 37 | |
| 38 | || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 39 | || 09:00~09:30 || 實作二:HDFS 操作實務 || || [wiki:ITRI0521/Lab3 實作三][[BR]][wiki:ITRI0521/Lab4 實作四] || || |
| 40 | || 09:30~10:00 || MapReduce 簡介 || [raw-attachment:wiki:ITRI0521:part-5.pdf part-5] || || || |
| 41 | || 10:00~10:40 || Hadoop 範例程式 WordCount 與觀念講解 || [https://raw.github.com/apache/hadoop/trunk/src/examples/org/apache/hadoop/examples/WordCount.java 程式碼] || || || |
| 42 | || 10:45~10:55 || 中場休息 || || || || |
| 43 | || 10:55~12:20 || Hadoop 叢集安裝設定解說 || [raw-attachment:wiki:ITRI0521:part-6.pdf part-6] || || || |
| 44 | || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 || |
| 45 | || 13:20~13:40 || 實作三:MapReduce 範例操作 || || [wiki:ITRI0521/Lab5 實作五][[BR]][wiki:ITRI0521/Lab6 實作六] || 1. [raw-attachment:wiki:jazz/12-05-04:12-05-04_DRBL-Hadoop-Bioinfomatics.pdf 叢集安裝與MapReduce除錯] || |
| 46 | || 13:40~14:00 || 實作四:Hadoop 程式編譯實務 || || [wiki:ITRI0521/Lab7 實作七][[BR]][wiki:ITRI0521/Lab8 實作八] || || |
| 47 | || 14:00~14:10 || 中場休息 || || || || |
| 48 | || 14:10~14:30 || Hadoop 相關專案(1) Hadoop Streaming || [raw-attachment:wiki:ITRI0521:part-7.pdf part-7] || || || |
| 49 | || 14:30~15:00 || 實作五:Hadoop Streaming 操作練習 || || [wiki:ITRI0521/Lab9 實作九][[BR]][wiki:ITRI0521/Lab10 實作十] || || |
| 50 | || 13:40~14:50 || Hadoop 相關專案(2) - Pig || [raw-attachment:wiki:ITRI0521:part-8.pdf part-8] || || || |
| 51 | || 14:50~15:10 || 實作六:Pig Latin 操作練習 || || [wiki:ITRI0521/Lab11 實作十一] || || |
| 52 | || 15:10~15:20 || 中場休息 || || || || |
| 53 | || 15:20~15:50 || HBase 操作觀察 || [raw-attachment:wiki:ITRI0521:part-7.pdf part-7] || [wiki:ITRI0521/Lab12 實作十二] || || |
| 54 | |
| 55 | = 參考書目 = |
| 56 | |
| 57 | 1. [http://forum.hadoop.tw/viewtopic.php?f=4&t=301 <學習資源> Hadoop 目前三本書籍] |
| 58 | 2. [http://lintool.github.com/MapReduceAlgorithms/MapReduce-book-final.pdf Data-Intensive Text Processing with MapReduce] (PDF),[http://www.umiacs.umd.edu/~jimmylin/book.html Jimmy Lin, University of Maryland] |
| 59 | |
| 60 | = 參考資料 = |
| 61 | |
| 62 | * [raw-attachment:wiki:jazz/hidoop:12-07-24_hiCloud_Hadoop.pdf 運用 hiCloud 搭建 Hadoop 叢集] |
| 63 | |
| 64 | * Hadoop 常見應用領域: |
| 65 | * [http://www-304.ibm.com/easyaccess/fileserve?contentid=217007 Data Intensive Analytics with Hadoop: A Look Inside] |
| 66 | * [http://www.youtube.com/watch?v=fVL93-OF1gc Using Hadoop to fight spam in Yahoo! Mail] - 雅虎信箱 |
| 67 | * 商業智慧 |
| 68 | * http://www.pentaho.com/ - Pentaho 這間 BI 公司是 Hadoop 技術的長期支持者 |
| 69 | * 金融業 |
| 70 | * 2010-10-12 : VISA 採用 Hadoop 做風險評估 - [http://www.slideshare.net/cloudera/hw09-large-scale-transaction-analysis HadoopWorld 2009 : Large Scale Transaction Analysis] |
| 71 | * 中國信託 |
| 72 | * 電信業 |
| 73 | * 2011-06-12 : [http://www.ithome.com.tw/itadm/article.php?c=68023 中華電信用Hadoop技術分析通話明細] |
| 74 | * 人力資源 |
| 75 | * [http://www.simplyhired.com/a/jobtrends/trend/q-xen%2C+hyper-v%2C+hbase%2C+hadoop SimplyHired 就業技能調查排行榜] |
| 76 | * [http://www.indeed.com/jobtrends?q=xen%2C+hyper-v%2C+hbase%2C+hadoop&l= Indeed 就業技能調查排行榜] |
| 77 | * 行銷趨勢 |
| 78 | * [http://www.eland.com.tw/solutions/opview_insight 意藍科技 雲端服務 OpView 品牌口碑雷達] - ([http://www.eland.com.tw/news/news/20100506 2010-05-06]) |
| 79 | * [http://www.i-buzz.com.tw/index.asp i-Buzz網路口碑研究中心] |
| 80 | * 科學教育 |
| 81 | * 生資 |
| 82 | * [http://www.slideshare.net/mndoci/hadoop-for-bioinformatics Hadoop for Bioinformatics] |
| 83 | * [http://cloudcomputing.sys-con.com/node/1869333 The Future of Hadoop in Bioinformatics] |
| 84 | * [http://abhishek-tiwari.com/2010/08/mapreduce-and-hadoop-algorithms-in-bioinformatics-papers.html Mapreduce and Hadoop Algorithms in Bioinformatics Papers] |
| 85 | * 統計 |
| 86 | * [https://mpi-inf.mpg.de/~rgemulla/publications/das10ricardo.pdf Ricardo: Integrating R and Hadoop] |
| 87 | * [http://www.rhipe.org RHIPE: R and Hadoop Integrated Programming Environment] |
| 88 | |
| 89 | * 免費課程 - 把類似今天的課程再聽一次 |
| 90 | * http://www.classcloud.org/media |
| 91 | * Hadoop 進階程式設計相關資訊 |
| 92 | * [http://trac.nchc.org.tw/cloud/wiki/NCHCCloudCourse110721 雲端運算進階課程(一)@ 新竹 - Hadoop 進階程式設計與 HBase 資料庫整合實作] |
| 93 | * [http://trac.nchc.org.tw/cloud/wiki/NCHCCloudCourse100928_2_IDE 編譯環境設定- 安裝 Eclipse 3.3.2 與 Hadoop 外掛程式] |
| 94 | * [http://trac.nchc.org.tw/cloud/wiki/NCHCCloudCourse100928/Netbeans 安裝 Netbean 6.9.1 中文版與 KamaSphere Studio 外掛程式] |
| 95 | |
| 96 | = 課後練習 = |
| 97 | |
| 98 | * 使用[http://trac.nchc.org.tw/cloud/wiki/Hadoop4Win Hadoop4Win] - 在 Windows 上安裝單機版 Hadoop 與 HBase 練習環境 ('''注意:僅供練習使用,請勿用於實際營運!''') |
| 99 | * 使用 HBase 0.90 改寫以上範例 [http://trac.nchc.org.tw/cloud/wiki/waue/2011/0426 code example ] |
| 100 | * [http://sourceforge.net/projects/drbl-hadoop/files/ DRBL-Hadoop Live CD] (CDH2, 0.20.x) - 國網中心 hadoop.nchc.org.tw 的底層作法,使用方法仍在整理中~但已足夠作為練習 Hadoop 的執行環境 |
| 101 | * 使用[http://www.cloudera.com/downloads/ Cloudera 提供的 VMWare Image] (CDH2, 0.20.x) |
| 102 | * 使用[http://developer.yahoo.com/hadoop/tutorial/module3.html#vm Yahoo! Hadoop Tutorial 的 VMWare Image] (0.20.S) |
| 103 | * 使用[http://code.google.com/intl/zh-TW/edu/parallel/tools/hadoopvm/index.html Google 提供的 Hadoop VMWare Image] (0.13,很舊了) |
| 104 | |
| 105 | = 公用環境 = |
| 106 | |
| 107 | * 課後問題討論,建議優先至台灣 Hadoop 使用者討論區 http://forum.hadoop.tw 進行討論。 |
| 108 | * 需要 Hadoop 叢集環境,可至 http://hadoop.nchc.org.tw 申請帳號。 |
| 109 | * 申請步驟,請參閱[wiki:YMU110509/Lab1 截圖說明] |
| 110 | * 關於公用叢集的幾個重要入口: |
| 111 | * http://hadoop.nchc.org.tw - 實驗叢集入口網站 |
| 112 | * http://hadoop.nchc.org.tw/ganglia - 實驗叢集負載狀態 |
| 113 | * http://hadoop.nchc.org.tw:50030 - 實驗叢集正在執行與執行完畢的任務 |
| 114 | * http://hadoop.nchc.org.tw:50070 - 實驗叢集的硬碟空間狀態 |
| 115 | * http://hadoop.nchc.org.tw/hadoop-doc - Hadoop 相關說明文件 |
| 116 | * http://hadoop.nchc.org.tw/hadoop-doc/api/index.html - Hadoop 0.20.2 javadoc 文件 |
| 117 | |
| 118 | = 輔助工具 = |
| 119 | |
| 120 | * [http://portableapps.com/apps/internet/firefox_portable/localization Firefox Portable (繁體中文版)] |
| 121 | * [http://azo-freeware.blogspot.com/2009/08/zoomit-40.html ZoomIt (簡報放大鏡)] |
| 122 | |
| 123 | * 中華電信 hicloud 帳務 - 02-23445568 |
| 124 | |
| 125 | = 科技新知 = |
| 126 | |
| 127 | * [[Image(http://readwrite.com/files/files/files/solution-series/assets_c/2011/05/infographicyottabyte_thumb1-thumb-560x1085-29962.jpg)]] |