Changes between Initial Version and Version 1 of TCCA140822


Ignore:
Timestamp:
Aug 22, 2014, 11:47:20 PM (10 years ago)
Author:
jazz
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • TCCA140822

    v1 v1  
     1{{{
     2#!html
     3<div style="text-align: center;"><big
     4 style="font-weight: bold;"><big><big>雲端巨量資料分析與應用</big></big></big></div>
     5}}}
     6[[PageOutline]]
     7
     8= 預備知識 =
     9
     10 * 具 Linux 操作實務與 Java 程式語言基礎者尤佳。
     11
     12= 課程日期 =
     13
     14 * 103 年 08 月 23 ~ 24 日 (週六/週日 白天 9:30 ~ 16:30 ),共 2 天、計 12 小時 。
     15
     16= 上課地點 =
     17
     18 * 台中市北區三民路三段 91 號 ( 台中科大育成中心 2F,203 教室)
     19
     20= 課程內容 =
     21
     22 * [raw-attachment:wiki:TCCA140822:14-08-23_Big_Data_and_Hadoop_Ecosystem.pdf 完整版投影片]
     23
     24== '''2014-08-22(六)''' ==
     25
     26 || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 ||
     27 || 09:00~11:05 || 淺談海量資料的趨勢、挑戰與因應對策 || [raw-attachment:wiki:TCCA140822:part-1.pdf part-1] || || 1.關於 NoSQL 的選擇依據 - [wiki:NCHCCloudCourse100928#補充資料 YCSB] [[BR]] 2. [http://nosql-database.org/ NoSQL 的種類] [[BR]] 3. [http://www.infoq.com/news/2011/04/newsql NoSQL vs NewSQL] [[BR]] 4. [http://www.slideshare.net/jazzwang/13-0702-bigdatataiwansupplychainandcommunities Big Data 產業供應鏈與人才現況] [[BR]] 5. [http://www.meetup.com/Taiwan-useR-Group Taiwan 學習統計/機器學習的社群] ||
     28 || 11:05~11:15 || 中場休息 || || || ||
     29 || 11:15~12:00 || 處理海量資料的資訊架構與關鍵技術 || [raw-attachment:wiki:TCCA140822:part-2.pdf part-2] || || 1. [http://www.slideshare.net/jazzwang/13-1202-bigdatapastnowfuture Big Data : Past, Now and Future] ||
     30 || 12:00~13:00 || 午餐、午休 || || || ||
     31 || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 ||
     32 || 11:10~12:00 || 實作一:Hadoop 單機安裝 || || [wiki:TCCA140822/Lab1 實作一][[BR]][wiki:TCCA140822/Lab2 實作二] || 1. [http://forum.hadoop.tw/viewtopic.php?p=40963#p40963 Hadoop 單機安裝(Ubuntu Linux)] ||
     33 || 13:00~14:20 || Hadoop 簡介:緣起與術語 || [raw-attachment:wiki:TCCA140822:part-3.pdf part-3] || || ||
     34 || 14:20~15:30 || HDFS 觀念與指令解說 || [raw-attachment:wiki:TCCA140822:part-4.pdf part-4] || || ||
     35 || 15:30~15:40 || 中場休息 || || || ||
     36 || 15:40~17:00 || 實作二:HDFS 操作實務 || || [wiki:TCCA140822/Lab3 實作三][[BR]][wiki:TCCA140822/Lab4 實作四] || ||
     37
     38== '''2014-06-15(日)''' ==
     39
     40 || 上午時段 || 課程內容 || 投影片 || 實作 || 補充資料 ||
     41 || 09:00~11:00 || MapReduce 簡介 || [raw-attachment:wiki:TCCA140822:part-5.pdf part-5] || || 1. [wiki:TCCA140822#參考資料 三種 Big Data 應用特性 vs 三種技術] [[BR]] 2. [http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/lib/ChainMapper.html ChainMapper], [http://hadoop.apache.org/docs/current/api/org/apache/hadoop/mapred/lib/ChainReducer.html ChainReducer] [[BR]] ||
     42 || 11:00~11:10 || 中場休息 || || || ||
     43 || 11:10~12:10 || 實作三:MapReduce 範例操作 || || [wiki:TCCA140822/Lab5 實作五][[BR]][wiki:TCCA140822/Lab6 實作六] || 1. [raw-attachment:wiki:jazz/12-05-04:12-05-04_DRBL-Hadoop-Bioinfomatics.pdf 叢集安裝與MapReduce除錯] ||
     44 || 下午時段 || 課程內容 || 投影片 || 實作 || 補充資料 ||
     45 || 13:10~13:40 || Hadoop 範例程式 WordCount 與觀念講解 || [https://raw.github.com/apache/hadoop/trunk/src/examples/org/apache/hadoop/examples/WordCount.java 程式碼] || || ||
     46 || 13:40~14:00 || Hadoop 相關專案(1) Hadoop Streaming || [raw-attachment:wiki:TCCA140822:part-7.pdf part-7] || || ||
     47 || 14:00~14:25 || 實作五:Hadoop Streaming 操作練習 || || [wiki:TCCA140822/Lab9 實作九][[BR]][wiki:TCCA140822/Lab10 實作十] || ||
     48 || 14:25~14:35 || 中場休息 || || || ||
     49 || 14:35~15:00 || Hadoop 叢集安裝設定解說 || [raw-attachment:wiki:TCCA140822:part-6.pdf part-6] || || ||
     50 || 15:00~15:30 || Hadoop 相關專案(2) - Pig || [raw-attachment:wiki:TCCA140822:part-8.pdf part-8] || || 1.[http://stackoverflow.com/questions/10942739/a-way-to-read-table-data-from-mysql-to-pig 將 Pig 運算結果透過 DBStorage 存到 MySQL 資料庫] [[BR]] 2. [http://sublogical.blogspot.tw/2011/10/cross-posted-from-my-company-blog-post.html 將 Pig 運算結果透過 HBaseStorage 存到 HBase 資料庫] ||
     51 || 15:30~16:00 || 實作六:Pig Latin 操作練習 || || [wiki:TCCA140822/Lab11 實作十一] || ||
     52 || 16:00~16:10 || 中場休息 || || || ||
     53 || 16:10~17:00 || HBase 操作觀察 || [raw-attachment:wiki:TCCA140822:part-7.pdf part-7] || [wiki:TCCA140822/Lab12 實作十二] || ||
     54 ||  || || || ||
     55 ||  || 實作四:Hadoop 程式編譯實務 || || [wiki:TCCA140822/Lab7 實作七][[BR]][wiki:TCCA140822/Lab8 實作八] || ||
     56
     57= 參考書目 =
     58
     59 1. [http://forum.hadoop.tw/viewtopic.php?f=4&t=301 <學習資源> Hadoop 目前三本書籍]
     60 2. [http://lintool.github.com/MapReduceAlgorithms/MapReduce-book-final.pdf Data-Intensive Text Processing with MapReduce] (PDF),[http://www.umiacs.umd.edu/~jimmylin/book.html Jimmy Lin, University of Maryland]
     61
     62= 參考資料 =
     63
     64 * [http://trac.3du.me/cloud/wiki/NCHCCloudCourse100928_MYSQL  Hadoop 與 RDBMS 的支援]
     65
     66 * [raw-attachment:wiki:jazz/hidoop:12-07-24_hiCloud_Hadoop.pdf 運用 hiCloud 搭建 Hadoop 叢集]
     67
     68 * Hadoop 常見應用領域:
     69   * [http://www-304.ibm.com/easyaccess/fileserve?contentid=217007 Data Intensive Analytics with Hadoop: A Look Inside]
     70   * [http://www.youtube.com/watch?v=fVL93-OF1gc Using Hadoop to fight spam in Yahoo! Mail] - 雅虎信箱
     71   * 商業智慧
     72     * http://www.pentaho.com/ - Pentaho 這間 BI 公司是 Hadoop 技術的長期支持者
     73   * 金融業
     74     * 2010-10-12 : VISA 採用 Hadoop 做風險評估 - [http://www.slideshare.net/cloudera/hw09-large-scale-transaction-analysis HadoopWorld 2009 : Large Scale Transaction Analysis]
     75     * 中國信託
     76   * 電信業
     77     * 2011-06-12 : [http://www.ithome.com.tw/itadm/article.php?c=68023 中華電信用Hadoop技術分析通話明細]
     78   * 人力資源
     79     * [http://www.simplyhired.com/a/jobtrends/trend/q-xen%2C+hyper-v%2C+hbase%2C+hadoop SimplyHired 就業技能調查排行榜]
     80     * [http://www.indeed.com/jobtrends?q=xen%2C+hyper-v%2C+hbase%2C+hadoop&l= Indeed 就業技能調查排行榜]
     81   * 行銷趨勢
     82     * [http://www.eland.com.tw/solutions/opview_insight 意藍科技 雲端服務 OpView 品牌口碑雷達] - ([http://www.eland.com.tw/news/news/20100506 2010-05-06])
     83     * [http://www.i-buzz.com.tw/index.asp i-Buzz網路口碑研究中心]
     84   * 科學教育
     85     * 生資
     86       * [http://www.slideshare.net/mndoci/hadoop-for-bioinformatics Hadoop for Bioinformatics]
     87       * [http://cloudcomputing.sys-con.com/node/1869333 The Future of Hadoop in Bioinformatics]
     88       * [http://abhishek-tiwari.com/2010/08/mapreduce-and-hadoop-algorithms-in-bioinformatics-papers.html Mapreduce and Hadoop Algorithms in Bioinformatics Papers]
     89     * 統計
     90       * [https://mpi-inf.mpg.de/~rgemulla/publications/das10ricardo.pdf Ricardo: Integrating R and Hadoop]
     91       * [http://www.rhipe.org RHIPE: R and Hadoop Integrated Programming Environment]
     92
     93= 課後練習 =
     94
     95 * 使用[http://trac.3du.me/cloud/wiki/Hadoop4Win Hadoop4Win] - 在 Windows 上安裝單機版 Hadoop 與 HBase 練習環境 ('''注意:僅供練習使用,請勿用於實際營運!''')
     96
     97= 輔助工具 =
     98
     99 * [http://portableapps.com/apps/internet/firefox_portable/localization Firefox Portable (繁體中文版)]
     100 * [http://azo-freeware.blogspot.com/2009/08/zoomit-40.html ZoomIt (簡報放大鏡)]