wiki:FDC110829
如何使用自由軟體執行雲端運算資料搜尋、分析與備份

課程資訊

  • 課程名稱:如何使用自由軟體執行雲端運算資料搜尋、分析與備份
  • 課程時數:6小時
  • 課程對象:資訊人員(雲端運算應用程式開發者和資訊中心管理者)
  • 上課方式:課堂講授與示範
  • 課程目標:

讓資訊人員了解:如何不需要自己建置主機和OS平台,而是透過網路利用雲端運算「平台即服務(PaaS)」的架構,就可以執行資訊的備份、搜尋、分析業務。這樣就可以大幅節省主機維護和排解疑難的預算、人力和時間。

課程內容

2011-08-29

主題 大綱 實作
平台即服務(PaaS)簡介 雲端運算服務的基本概念
使用自由軟體打造PaaS 資料異機同步儲存的機制:Dropbox
巨量資料分析處理平台:Hadoop
打造私有資料的搜尋引擎:Nutch
多種檔案格式的搜尋引擎:Crawlzilla
http://demo.crawlzilla.info
http://icas.classcloud.org - 網路入侵偵測日誌分析系統
http://www.dropbox.com
午休
補充一:HDFS 補充 實作一 - 實驗叢集帳號申請
http://www.virtualbox.org
http://drbl-hadoop.sf.net
實作二 - HDFS 操作實務
補充二:MapReduce 補充 實作三 - MapReduce 範例初探
實作四 - MapReduce 程式編譯
補充三:Hadoop 生態系補充 實作五 - Hadoop Streaming 初探
實作六 - <範例> 用 Hadoop Streaming 做生物資訊(或 OCR 軟體)
實作七 - Pig Latin 豬的拉丁語
Last modified 13 years ago Last modified on Aug 31, 2011, 5:26:33 PM