| Version 27 (modified by jazz, 15 years ago) (diff) | 
|---|
2009-04-14
- Hadoop 叢集
- 升級至 Lenny
 - 重新蒐集 MAC Address 讓 hostname 盡量與 KVM 順序相仿
 - 安裝 Power Management ,由於機房有限制單一插座總電流不得大於 12 安培,因此不能插滿八個電源孔。
 - [消防/資安] Power KVM 的電源線也必須注意可容納的電流上限。
 
 
hostname hadoop107 hadoop108 hadoop109 hadoop110 hadoop hadoop111 hadoop112 KVM 9 10 11 12 13 14 15 Power KVM 1G 2A 2B 2C 2D 2E 2F 
hostname hadoop106 hadoop105 hadoop104 hadoop103 hadoop102 hadoop101 KVM 6 5 4 3 2 1 Power KVM 1F 1E 1D 1C 1B 1A 
Hadoop
- 從 Y!TW 蔡奕楷 12/06 的 Hadoop - Open source grid computing platform 演講投影片,看到一個有趣的指令叫 hod,回想起先前在 Hadoop 官方網站上看到的 Hadoop On Demand,簡單瞄了一下文件,HOD 主要是用 Python 寫的格網叢集佈署工具,用 Torque 或 Maui 當資源管理(Resource Manager)和排程器(Scheduler)。雖然文件裡寫著 Virtual Hadoop Cluster,不過沒有看到虛擬化技術的需求跟描述,因此應該僅僅只是在實體叢集中,切割部分節點來組成一個 Hadoop 叢集。
 
Virtualization
- Users warned of virtualization's 'dark side' - 虛擬化的'黑暗面'
 
MapReduce
- 持續蒐集一些 MapReduce 不同語言的實作....
 
- R
- The R-Project and Map Reduce
 - http://ml.stat.purdue.edu/rhipe/ - Wow!! RHIPE - R and Hadoop Integrated Processing v.0.1 這兩個的結合真是符合我們目前的方向啊!!!
 - http://cran.r-project.org/web/packages/mapReduce/ - R 官方的 mapReduce 套件 mapReduce - flexible mapReduce algorithm for parallel computation
 - 更神奇的是 Amazon Web Service 也有支援 R 呢!! 
Develop your data processing application authored in your choice of Java, Ruby, Perl, Python, PHP, R, or C++.
 
 - Java
- GridGain - Java 寫的 MapReduce Framework
 - Hive - 架構在 Hadoop 之上,由 facebook 主導的專案
 - Cloud MapReduce - A MapReduce implementation on Amazon Cloud OS
 
 - C/C++
 - Perl
- Parallel::MapReduce
 - PlasmaFS - implements the map/reduce framework on a compute cluster
 
 - Python
- FileMap - 原始碼
 - Disco - 核心用 Erlang 寫的,Job 管理可以用 Python 撰寫。
 - dumbo - 跟 Hadoop 的關聯性非常強,因為這個專案就是 Hadoop Stream 裡的 Python 實作
 - Prince - API for Hadoop/MapReduce? in Python, 2010 (2010-05-12)
 - octopy - Easy MapReduce for Python (2010-08-24)
 - httpmr - A scalable data processing framework for people with web clusters. (2010-08-24) - 架在 Google App Engine 之上
 - misco - A Mobile MapReduce Framework
 - mrjob - a Python package that helps you write and run Hadoop Streaming jobs. It supports Amazon's Elastic MapReduce (EMR) service and also works with your own Hadoop cluster.
 
 - Ruby
 - Erlang
- Riak : An Open Source Internet-Scale Data Store
 
 - CUDA
 - Qt
- QtConcurrent
- Open Source C++ MapReduce (non-distributed) implementation from Trolltech
 - 網頁寫說適用於 shared-memory (non-distributed) systems。
 
 
 - QtConcurrent
 - bash
- Mapreduce Bash Script - 用 bash shell script 寫的 MapReduce - 原始碼
 
 - JavaScript
- Collaborative Map-Reduce in the Browser - 這個實作所要提倡的精神有點類似 SETI@Home,也就是希望藉由群眾的力量,來打造以 HTTP 為標準的分散式叢集。
 
 - .NET
- Qizmt - MySpace just released a MapReduce framework for .NET called Qizmt as an open source project. - 簡介影片 - 原始碼下載
 - Dryad - DryadLINQ (2010-08-24)
 - http://mapsharp.codeplex.com/ (2010-08-31)
 - http://code.google.com/p/hadoopdotnet/ (2010-08-31)
 
 - MPI
 - MySQL
 
HBase / CouchDB
- 在看維基百科的時候,發現 CouchDB 同時被分屬在 Column-oriented DBMS 跟 Document-oriented database
 - Interactive CouchDB - 這裡用 Java Script 示範了 CouchDB 結合不同用途的 MapReduce 實作。
 
