詞語(yǔ)解釋
基本體系結(jié)構(gòu)
1.機(jī)群系統(tǒng)一般結(jié)構(gòu)
機(jī)群(cluster)系統(tǒng)是互相連接的多個(gè)獨(dú)立計(jì)算機(jī)的集合,這些計(jì)算機(jī)可以是單機(jī)或多處理器系統(tǒng)(PC、工作站或SMP),每個(gè)結(jié)點(diǎn)都有自己的存儲(chǔ)器、I/O設(shè)備和操作系統(tǒng)。機(jī)群對(duì)用戶(hù)和應(yīng)用來(lái)說(shuō)是一個(gè)單一的系統(tǒng),它可以提供低價(jià)高效的高性能環(huán)境和快速可靠的服務(wù)。
機(jī)群系統(tǒng)包括下列組件:
·高性能的計(jì)算結(jié)點(diǎn)機(jī)(PC、工作站或SMP)。
·具有較強(qiáng)網(wǎng)絡(luò)功能的微內(nèi)核操作系統(tǒng)。
·高效的網(wǎng)絡(luò)/交換機(jī)(如千兆位以太網(wǎng)和Myrinet)。
·網(wǎng)卡(NICs)。
·快速傳輸協(xié)議和服務(wù)。
·中間件層,其中包括某些支持硬件,如數(shù)字存儲(chǔ)通道、硬件分布共享存儲(chǔ)器及SMP技術(shù);應(yīng)用,如系統(tǒng)管理工具和電子表格;運(yùn)行系統(tǒng),如軟件分布共享存儲(chǔ)器和并行文件系統(tǒng);資源管理和調(diào)度軟件等。
·并行程序設(shè)計(jì)環(huán)境與工具,如編譯器、語(yǔ)言環(huán)境、并行虛擬機(jī)(PVM)和消息傳遞接口(MPI)等。
·應(yīng)用,包括串行和并行應(yīng)用程序。
2.組建機(jī)群系統(tǒng)的需求和功能
機(jī)群組建時(shí)應(yīng)考慮下面的需求和功能:
·較高帶寬的網(wǎng)絡(luò),以支持通信需求;
·低延遲的通信機(jī)制;
·支持高帶寬的多點(diǎn)傳送通信方式;
·自動(dòng)恢復(fù)網(wǎng)絡(luò)和結(jié)點(diǎn)錯(cuò)誤的能力;
·標(biāo)準(zhǔn)的低級(jí)原語(yǔ),支持通信、同步和時(shí)序;
·異構(gòu)的遠(yuǎn)程過(guò)程調(diào)用,以隱藏體系結(jié)構(gòu)、協(xié)議和系統(tǒng)的不同性;
·實(shí)時(shí)性能監(jiān)視器;
·可靠的批處理工作調(diào)度程序;
·分布應(yīng)用程序開(kāi)發(fā)工具;
·支持傳統(tǒng)的高級(jí)語(yǔ)言進(jìn)行異構(gòu)計(jì)算;
·能夠開(kāi)發(fā)工作站機(jī)群的應(yīng)用程序;
·新的系統(tǒng)管理工具;
·發(fā)展標(biāo)準(zhǔn)化,以保護(hù)軟件投資。
3.機(jī)群系統(tǒng)與其他系統(tǒng)的比較
一個(gè)典型機(jī)群系統(tǒng)和其他類(lèi)型系統(tǒng)的對(duì)比可參看下表。
基本類(lèi)型
機(jī)群系統(tǒng)可以按照應(yīng)用或結(jié)構(gòu)進(jìn)行分類(lèi)。
1.按應(yīng)用目標(biāo)
可分為面向科學(xué)計(jì)算型或面向關(guān)鍵任務(wù)應(yīng)用型:
·高性能機(jī)群(high performance cluster);
·高可用性機(jī)群(high availability cluster)。
2.按組成機(jī)群的處理機(jī)類(lèi)型
·PC機(jī)群;
·工作站機(jī)群;
·SMP(對(duì)稱(chēng)多處理器)機(jī)群。
3.按處理機(jī)操作系統(tǒng)
·Linux機(jī)群,如Beowulf;
·Solaris機(jī)群,如Berkeley NOW;
·NT機(jī)群,如HPVM;
·AIX機(jī)群,如IBM SP2;
·數(shù)字VMS(虛擬存儲(chǔ)機(jī))機(jī)群;
·HP-UX機(jī)群;
·微軟Wolfpack機(jī)群。
4.按處理機(jī)的配置
·同構(gòu)型機(jī)群:所有結(jié)點(diǎn)擁有近似的構(gòu)造和相同的操作系統(tǒng);
·非同構(gòu)型機(jī)群:所有結(jié)點(diǎn)擁有不同的構(gòu)造和不同的操作系統(tǒng)。
5.按處理機(jī)的位置和數(shù)量
·組機(jī)群,結(jié)點(diǎn)數(shù)量為2~99,通過(guò)SANs(系統(tǒng)級(jí)網(wǎng)絡(luò)),如Myrinet,機(jī)群實(shí)際上裝入一個(gè)機(jī)箱中或存在一個(gè)范圍之內(nèi);
·部門(mén)機(jī)群,結(jié)點(diǎn)數(shù)量為幾十或幾百;
·企業(yè)機(jī)群,結(jié)點(diǎn)數(shù)量為幾百。
6.按構(gòu)筑機(jī)群的方式
·專(zhuān)用機(jī)群;
·非專(zhuān)用機(jī)群。
極高的性能價(jià)格比使專(zhuān)用機(jī)群深受歡迎。
專(zhuān)用機(jī)群
專(zhuān)用機(jī)群一般由一組同構(gòu)的處理機(jī)組成(有時(shí)也有異構(gòu)情況),通常安裝在一個(gè)機(jī)房?jī)?nèi),或者將主板等安裝在一個(gè)機(jī)柜的各機(jī)箱中(商業(yè)機(jī)群常用這種方式),或像圖中那樣簡(jiǎn)單地把PC機(jī)堆砌在機(jī)架上(Piles of PC)。在這種機(jī)群中,每個(gè)處理機(jī)都是專(zhuān)用的、無(wú)屬主的,由系統(tǒng)管理員統(tǒng)一管理,用戶(hù)可通過(guò)前端機(jī)進(jìn)行訪問(wèn),用戶(hù)無(wú)需知道機(jī)群的詳情,就像使用MPP機(jī)一樣,易于配置和管理,不受外界干擾,通信可靠且延遲小,適合于面向加速比的并行任務(wù)和面向吞吐量批處理作業(yè)。專(zhuān)用機(jī)群具有相對(duì)結(jié)構(gòu)和管理簡(jiǎn)單、易于擴(kuò)展等特點(diǎn),用途極廣。
專(zhuān)用機(jī)群的互聯(lián)結(jié)構(gòu)通常有以下兩種方式:
·I/O方式 包括普通用LAN、FDDI、ATM等網(wǎng)絡(luò)連接和共享磁盤(pán)連接兩種方式。
·共享存儲(chǔ)器方式 包括全局共享存儲(chǔ)器方式和分布式共享存儲(chǔ)器方式。分布式存儲(chǔ)器指沒(méi)有一個(gè)集中的存儲(chǔ)器,由各處理機(jī)內(nèi)一部分存儲(chǔ)器通過(guò)軟件機(jī)制形成。
1994年夏,美國(guó)的研究人員建成了第一個(gè)Beowulf機(jī)群,它由16個(gè)DX4處理機(jī)組成。1997年,又推出了16個(gè)基于PⅡ的機(jī)群,只需花費(fèi)5萬(wàn)美元卻具有每秒10億次的浮點(diǎn)運(yùn)算能力,而購(gòu)買(mǎi)具有相同能力并行機(jī)的投資數(shù)卻是它的10倍。 Berkeley的NOW系統(tǒng)也是較早的工作站機(jī)群,由上百個(gè)Sun Ultra工作站組成,集成到19 英寸機(jī)箱中,可使用Myrinet、ATM和終端集中器等多種互聯(lián)手段,每個(gè)結(jié)點(diǎn)自帶512K緩存、128M內(nèi)存及2個(gè)2.3G硬盤(pán)。
此外,各大公司推出的商業(yè)專(zhuān)用機(jī)群還有很多,如DEC 的VMS機(jī)群和TruCluster、惠普的Apollo 9000機(jī)群、IBM的Sysplex、Sun的Solaris MC 等。
在國(guó)內(nèi),曙光公司最新推出了基于NT的天潮系列機(jī)群產(chǎn)品,是采用分布式存儲(chǔ)的可擴(kuò)展機(jī)群體系。其結(jié)點(diǎn)處理器為Intel PⅡ和PⅢ,通過(guò)千兆位以太網(wǎng)互聯(lián),擴(kuò)展性好,結(jié)點(diǎn)可根據(jù)不同的應(yīng)用,動(dòng)態(tài)地分為多個(gè)結(jié)點(diǎn)池,如可用兩個(gè)結(jié)點(diǎn)作為服務(wù)器、四個(gè)結(jié)點(diǎn)運(yùn)行數(shù)據(jù)庫(kù)、其他結(jié)點(diǎn)用于計(jì)算等,結(jié)點(diǎn)數(shù)量可靈活配置。應(yīng)用范圍包括:
科學(xué)計(jì)算 支持PVM和MPI,使用優(yōu)化的BLAS庫(kù);事務(wù)處理 在線(xiàn)事務(wù)處理(OLTP),如電子商務(wù)、證券交易和在線(xiàn)分析處理(OLAP);并行數(shù)據(jù)庫(kù) 支持Oracle、DB2等分布式數(shù)據(jù)庫(kù)應(yīng)用;
網(wǎng)絡(luò)服務(wù)器 運(yùn)行各種Internet服務(wù)。
非專(zhuān)用機(jī)群
非專(zhuān)用機(jī)群是由分散互聯(lián)的處理機(jī)或在網(wǎng)上尋找到的空閑處理機(jī)組成的機(jī)群,這些處理機(jī)可能分屬于不同的個(gè)人、組織或單位。據(jù)資料統(tǒng)計(jì),一般計(jì)算機(jī)系統(tǒng)平均使用率僅為30%左右,有的空閑率竟達(dá)91%,而許多桌面網(wǎng)絡(luò)工作站和微機(jī)的CPU利用率都小于10%,因此,人們自然想到要利用這些閑散的CPU處理能力,這被稱(chēng)為CPU周期竊取。
通常,網(wǎng)絡(luò)上計(jì)算單元都是擁有者各自孤立地使用其擁有的計(jì)算單元,一般處于下列狀態(tài):
·處于空閑或等待狀態(tài),如夜間;
·文檔編輯工作,包括收發(fā)E-mail、閱讀文檔和信息等;
·開(kāi)發(fā)工作,包括編輯、編程、編譯、調(diào)試等;
·完成某種定時(shí)、守候服務(wù)和功能;
·運(yùn)行計(jì)算型的程序。
所謂竊取CPU周期就是要竊取上述前四類(lèi)處理機(jī)的CPU 周期給最后一類(lèi)工作用。顯然,被竊取CPU周期的處理機(jī)包括空閑的處理機(jī)和CPU負(fù)載較輕的處理機(jī)兩類(lèi)。
非專(zhuān)用機(jī)群地理上分布于不同的所有者,由異構(gòu)系統(tǒng)組成,大部分通過(guò)以太網(wǎng)連接,適用于企業(yè)級(jí)局域網(wǎng)范圍,技術(shù)難度要高于專(zhuān)用機(jī)群。工作站的主人與需占用工作站資源運(yùn)行程序的遠(yuǎn)程用戶(hù)之間存在著矛盾,前者希望與工作站快速交互,而后者只關(guān)心能否利用所有的共享CPU來(lái)快速運(yùn)行程序。機(jī)器的所有者必須具有參加機(jī)群的動(dòng)機(jī),這意味著他們相信貢獻(xiàn)他們的資源是有意義的。但是,這些所有者不希望在他們工作時(shí)或他們的系統(tǒng)過(guò)于飽和時(shí),受到其他干擾,一個(gè)解決的策略是允許所有者退出機(jī)群。目前,國(guó)際上正在形成一種計(jì)算資源的買(mǎi)賣(mài)市場(chǎng),以刺激資源擁有者加入網(wǎng)上機(jī)群。此外,由于當(dāng)前網(wǎng)絡(luò)通信速度和質(zhì)量的瓶頸所限及由通信競(jìng)爭(zhēng)造成的網(wǎng)絡(luò)不確定性的存在,對(duì)非專(zhuān)用機(jī)群技術(shù)提出了更高的要求,如對(duì)進(jìn)程遷移、負(fù)載平衡等技術(shù)的需求。但此類(lèi)系統(tǒng)最為貼近普通用戶(hù),可以充分利用網(wǎng)上無(wú)窮無(wú)盡的資源,而組建投資幾乎可忽略不計(jì)?梢灶A(yù)見(jiàn),隨著網(wǎng)絡(luò)瓶頸問(wèn)題的緩解,非專(zhuān)用機(jī)群必然是極有發(fā)展前途的一種計(jì)算形式。
掃碼付費(fèi)即可復(fù)制
XSmeasure | AdjCellNum | CellSelectType | JudgeType | HcTag | TimerTarHandover | TimerSrcHandover | TimerPrepare | Speeffthred2_TM7 | Speeffthred1_TM7 | PaSrb | PaDrb |