近日,中國(guó)移動(dòng)智算中心(哈爾濱)正式宣布上線投產(chǎn),成為全球運(yùn)營(yíng)商最大單集群智算中心。
該智算中心單集群內(nèi)配備了超過(guò)18000張AI加速卡,智能算力規(guī)模高達(dá)6.9EFLOPS。憑借其單集群算力規(guī)模之最、國(guó)產(chǎn)化網(wǎng)絡(luò)設(shè)備組網(wǎng)規(guī)模之最,傲視群雄。
此項(xiàng)集群規(guī)模不僅采用了高性能無(wú)損網(wǎng)絡(luò)、全調(diào)度以太網(wǎng)GSE1.0、融合分級(jí)存儲(chǔ)等一系列創(chuàng)新技術(shù),還搭載了移動(dòng)云智算平臺(tái)和智管平臺(tái),支持萬(wàn)卡并行訓(xùn)練、斷點(diǎn)續(xù)訓(xùn)、AI任務(wù)全生命周期管理及分鐘級(jí)故障定界定位等功能。這些功能使得集群算效與能效均達(dá)到了行業(yè)領(lǐng)先水平。
該集群也是繼中國(guó)移動(dòng)智算中心(呼和浩特)(全球運(yùn)營(yíng)商最大單體智算中心)上線運(yùn)行后,中國(guó)移動(dòng)打造的業(yè)內(nèi)首個(gè)端到端使用全國(guó)產(chǎn)設(shè)備的超大規(guī)模智算集群,標(biāo)志著我國(guó)國(guó)產(chǎn)芯片商用部署達(dá)到了新的高度。
該智算中心通過(guò)把所有AI加速卡整合為一個(gè)集群,并運(yùn)用先進(jìn)的智算網(wǎng)絡(luò)技術(shù),將上萬(wàn)塊GPU芯片高效拼接,數(shù)據(jù)訓(xùn)練完成時(shí)間縮短了20%,滿足萬(wàn)億參數(shù)大模型的訓(xùn)練需求。