寶德科技服務器研發(fā)工程師 陳振智
從高密度機架優(yōu)化式機架式服務器問世到現(xiàn)在已經(jīng)有兩年多時間了,其小巧緊湊的外型、主流的性能非常適合高密度機房環(huán)境,契合了企業(yè)用戶IT系統(tǒng)建設"數(shù)據(jù)集中、高效處理"的趨勢,博得廣泛歡迎,F(xiàn)在,用戶不僅已經(jīng)接受了機架式服務器,而且在新購服務器時,大多數(shù)的用戶會首選機架式服務器。據(jù)賽迪咨詢2002初的調(diào)查結(jié)果顯示,機架式服務器占新購服務器比例的49%,超過了傳統(tǒng)的塔式服務器,更有一知名公司統(tǒng)計得出其機架式服務器銷售將年增長80%多的結(jié)論。
但是,機架式服務器在內(nèi)部的設計上有其特別高要求。首先是高可用性。機架式服務器內(nèi)部狹小又應用于高密度環(huán)境下,對散熱的要求更為苛刻;其次,它必須是易管理的。由于機架式服務器往往是幾十上百架的疊放,且不帶自己的監(jiān)視器和輸入設備,網(wǎng)管人員一是難以找到發(fā)生故障的機器,二是找到后的維護十分不便。此時,WEB管理、自動預警等管理特性就十分主要。針對這些特性,我們從客戶實際應用的角度入手,進行技術創(chuàng)新,完善了機架式服務器的可管理性、穩(wěn)定性與高可用性等關鍵性能,引領機架式服務器技術潮流。并因此獲得用戶青睞。
現(xiàn)在就讓我們走近"新一代高密度機架優(yōu)化式服務器先鋒"---寶德PT1300R與PT2300R,一探究竟。
真正安全的硬盤熱插拔技術
問題:當插入新硬盤或拔出一個硬盤時,硬盤可能會被正在工作的電源損壞。
解決方案:寶德PT1300r/2300r硬盤熱插拔背板使用了電源隔離技術,實現(xiàn)真正安全的硬盤熱插拔。在PT1300r/2300r硬盤熱插拔背板上,每個SCA硬盤接口的電源都分別被獨立的電源開關控制。當硬盤背板通過SCSI總線探測到一個硬盤可能存在故障時,這個硬盤的電源將會被關閉,這時這個故障硬盤就可以被安全拔出,減小硬盤被損壞的可能性。當一個新的硬盤插入時,電源控制系統(tǒng)會稍等片刻,待硬盤完全插到位后,才會給硬盤上電。當硬盤熱插拔背板探測到一個硬盤被拔出時,它將會立即切斷這個硬盤槽的電源供應。這將防止當硬盤只是被局部拔出又重新被插回時對硬盤可能造成的損壞。同時也防止可能的供應電壓的下降造成整個硬盤陣列的中斷。另外,PT1300r/2300r的硬盤熱插拔背板還支持熱備用硬盤的電源控制。熱備用硬盤的電源始終處于被關閉狀態(tài)直到一個硬盤發(fā)生故障。當一個硬盤出現(xiàn)故障時,熱備用硬盤的電源將會被自動打開,并立即進入服務,而不需要操作員的干涉去更換硬盤。最后,當插入一個短路的硬盤或一個硬盤在操作時發(fā)生短路時,PT1300r/2300r硬盤熱插拔背板還支持電源控制線路的自動旁路。這樣可以防止熱插拔SCSI背板被短路硬盤所產(chǎn)生的過大電流損壞。
故障彈性引導技術
問題:一個故障的處理器會使服務器無法引導,導致服務器宕機。
解決方案:寶德PT1300r/2300r服務器使用故障彈性引導技術來徹底避免由于一個服務器CPU故障而引起的服務器當機,以保證服務器的高可用性。也就是說如果PT1300r/2300r服務器所配置的第一個CPU在執(zhí)行引導過程時失敗,將會導致系統(tǒng)FRB1計時器超時,并觸發(fā)FRB1超時事件。這時系統(tǒng)集成的專用服務器管理處理器將會發(fā)出命令把第一個CPU屏蔽,并把執(zhí)行引導任務轉(zhuǎn)交給第二個CPU。如果第二個CPU功能正常,系統(tǒng)將仍然可以被正常引導。這樣即便在系統(tǒng)的一個CPU出現(xiàn)故障的情況下,系統(tǒng)仍可被正常引導,實現(xiàn)最大的高可用。
著眼未來的電源及散熱系統(tǒng)設計
問題:當系統(tǒng)升級到更高頻率的CPU時,系統(tǒng)的電源及散熱需求也將隨之增長。
解決方案:寶德PT1300r/PT2300r 服務器包含強健的電源供應、電壓調(diào)節(jié)電路及散熱系統(tǒng),它不同其它廠商所使用的標準方法,而是按照額定的功率需求來設計電源及散熱系統(tǒng)。其它標準方法一般是按照實際采樣的CPU樣品的電源及發(fā)熱來設計(一般要小于額定功率),而且使用"標準"技術,將需要大量的CPU樣品,才能保證統(tǒng)計結(jié)果的有效性。寶德PT1300r/PT2300r是目前第一款上市時就能支持更高主頻的Xeon DP家族處理器產(chǎn)品功率及散熱需求的高密度機架優(yōu)化式服務器。這樣當升級到更高主頻的處理器時,機箱結(jié)構無需任何改變,就能滿足機器散熱需求,有效保護用戶的投資及降低總保有成本TCO。
實時散熱監(jiān)控技術
問題:新至強處理器對更高的散熱風量的需求將增大機器噪音并會降低風扇壽命。
解決方案:寶德PT1300r/PT2300r服務器使用領先的實時散熱監(jiān)控技術。集成的專用服務器管理處理器不斷地實時地從智能前面板、CPU、硬盤熱插拔背板及其它關鍵組件傳感器處讀取溫度信息,將所讀取的溫度值與存儲在主板上的系統(tǒng)管理數(shù)據(jù)庫中的閾值進行比較。如果從某組件所讀取的溫度值大于數(shù)據(jù)庫中的閾值,負責該組件散熱的風扇會根據(jù)最低的需求級別自動提速;反之,散熱風扇則自動降速,以提供合適的風量。此過程不斷重復循環(huán),保證系統(tǒng)在涼快、安靜運行的同時,最大程度的延長風扇壽命。
指示燈導向的故障診斷
問題:故障組件需要用很長時間來診斷、識別、更換。
解決方案:寶德PT1300r/PT2300r服務器使用指示燈導向的故障診斷技術來快速鎖定故障組件并快速更放,以實現(xiàn)最小的當機時間。PT1300r/PT2300r服務器集成的專用服務器管理處理器實時監(jiān)控系統(tǒng)關鍵組件的狀態(tài),并通過各種LED指示燈來表示各組件的健康狀況。其中智能前控制面板共有5個不同指示燈可以表示15種不同的狀態(tài)級別告之管理員機器目前的運行狀況及可能潛在的問題;位于機器前面板及機器背后的系統(tǒng)ID識別燈,可以在機架式環(huán)境中快速定位目標服務器;服務器主板上的各種不同的指示燈可以幫助技術人員快速鎖定故障部件如內(nèi)存槽、風扇、處理器等,并迅速更換,實現(xiàn)最大的正常運行時間。
先進的硬盤固定技術
問題: 高性能、高轉(zhuǎn)速的硬盤會引起更大的硬盤顫動,導至硬盤壽命的減少及性能的降低。
解決方案:寶德PT1300r/PT2300r服務器使用目前最為先進的機械工程技術來設計硬盤籠子,使用高級鋁型材嵌板來作為硬盤籠子的內(nèi)壁,用來固定硬盤。當硬盤被插入時,堅硬的籠子嵌板會阻止硬盤被推出,減少潛在的硬盤顫動。如果一個廠商使用不那么堅硬的材料,硬盤籠子可能會彎曲變型,增大潛在的硬盤顫動風險。另外PT1300r/PT2300r服務器所使用的熱插拔硬盤拖架采用僅在每個熱插拔硬盤拖架的一邊使用彈片的設計方案,這樣能更好的更長久地固定硬盤,避免其顫動。而有些廠商的硬盤拖架則在其兩邊都使用彈片,這樣的設計在經(jīng)過一段時間以后將會使硬盤產(chǎn)生輕微振蕩的風險加大,最終可能導致硬盤性能降低并使硬盤壽命減短。
第十代壓力測試軟件認證測試
問題: 高性能系統(tǒng)中不同的數(shù)據(jù)類型及不同的數(shù)據(jù)使用模式的融合,導至潛在的數(shù)據(jù)損壞的風險加大。
解決方案:寶德使用先進的壓力測試軟件對服務器在各種主流操作系統(tǒng)平臺下進行嚴格認證測試,以保證服務器真正高品質(zhì)、高可靠。寶德PT1300r/2300r正是經(jīng)過Intel? 第十代壓力測試軟件認證測試的新一代高密度機架優(yōu)化式服務器。EPSD(Enterprise platform service division)部門不斷地更新及提升僅用于內(nèi)部測試的服務器壓力測試軟件套件,認證壓力測試軟件套件可以模擬產(chǎn)生極大的工作負載以檢驗最新服務器的每秒幾個GB的帶寬能力。新的、產(chǎn)生更大壓力的數(shù)據(jù)格式正在被許多開發(fā)團體不斷地定義,只有不斷提升及改善壓力測試軟件,才可能使認證測試更加有效,才能保證經(jīng)過認證測試的服務器真正高質(zhì)量、高可用,經(jīng)得起各種數(shù)據(jù)壓力考驗。
CHINA通信網(wǎng)組稿