Version 5 (modified by rock, 15 years ago) (diff) |
---|
SGE 初體驗
【不負責前言】
- 萬丈高樓平地起,相對的以資訊技術來說,系統平台層(System/Platform? level) 穩固之後,就會到了 中介層(Middle) 和 應用層(Application)。相對於虛擬化平台穩固之後的下一步,(忘了是那一個講者說的,虛擬化之後的下一步就是自動化),不外忽視讓虛擬化的資源可以根據任務或應用來動態產生,和工作分配。
- 而本組對於 OpenNEbula 也頗有研究心得,OpenNEbula 發展早期也是聚焦於如何佈署虛擬機器於多台實體機器上 (也就是管理多台機器上的Hypervisior),隨著成熟發展,OpenNEbula 收到使用者的回饋和實際用做經驗,在 OpenNEbula 前端需要一個 DRM(Distributed Resource manage) 和任務分配管理,於是 OpenNEbula 變相中了也是開放原始碼的 Sun Grid Engine (現在改名叫 Oracle Grid Engine),再他們的官方文件也是建議使用者使用 SGE。
- 根據中研院的SGE的使用報告能力似乎優於 Torque。
【SGE 官方文件重點摘要】
- 官方的文件落落長,主要分為四部份:
- N1 Grid Engine 6 Installation Guide
- N1 Grid Engine 6 Administration Guide
- N1 Grid Engine 6 User's Guide
- Grid Engine Management Module User's Guide
- N1 Grid Engine 6 Release Notes
【SGE 架構】
- 看了 N1 Grid Engine 6 Installation Guide h,從 SGE 的安裝流程,可以看到幾個重要的架構元件:
- Master Host :主要運作 sge_qmaster 和 sge_schedd
- Execution Host :sge_execd
- Administrator Host :最簡單是設定跟 Master 同一台
- Submit Host :最簡單是設定跟 Master 同一台
- DB spooling server :最簡單是設定跟 Master 同一台
- 如果套用到 DRBL Virtualization 的架構來看,就是下圖
【SGE 安裝】
[1. 下載 SGE binary]
- http://gridengine.sunsource.net/downloads/latest.html
- 解壓縮並移到 /home 路徑下
$ su - # tar zxvf ge62u5_lx24-amd64.tar.gz # sudo mv ge6.2u5 /home # tar zxvf ge-6.2u5-bin-lx24-amd64.tar.gz # tar zxvf ge-6.2u5-common.tar.gz
[2. 環境配置]
- 檢查 /etc/hosts 資訊是否正確?
- root 是否可免密碼 ssh 到其他 nodes?
- 宣告 SGE_ROOT 環境變數
$ su - # echo export SGE_ROOT=/home/ge6.2u5 >> ~/.bashrc # source ~/.bashrc # echo $SGE_ROOT
- 配置檔案權限
# ./util/setfileperm.sh $SGE_ROO
[2. 安裝 Master Host]
[3. 安裝 Execution Host]
【SGE 操作】
【Reference】
Attachments (1)
- SGE_DRBL-Virtualization.png (32.5 KB) - added by rock 15 years ago.
Download all attachments as: .zip