1月16日,“智算中心互聯(lián):算網(wǎng)協(xié)同,構(gòu)筑智算互聯(lián)新底座”線上研討會順利召開。本次研討會圍繞智算中心間的算力協(xié)同與調(diào)度以及智算中心互聯(lián)關(guān)鍵技術(shù)等話題展開了深入探討。
中國聯(lián)通研究院副院長、首席科學家唐雄燕應邀作了題為《構(gòu)建算力智聯(lián)網(wǎng)AINet,推進算網(wǎng)協(xié)同》的主題報告。他指出,智能計算的發(fā)展對帶寬和網(wǎng)絡質(zhì)量提出了越來越高的要求,主要體現(xiàn)在高通量、低時延、高可靠三個方面。為了更好地支撐智算互聯(lián)的需要,2024年,中國聯(lián)通正式發(fā)布算力智聯(lián)網(wǎng)AINet,通過IP+光融合打造新質(zhì)運力,實現(xiàn)算力服務與網(wǎng)絡服務協(xié)同,構(gòu)建算力互聯(lián)網(wǎng)的新底座。
唐雄燕表示,AINet具備高通量、高性能、高智能的“三高”核心能力。其中,高通量主要是針對數(shù)據(jù)傳輸管道,構(gòu)建高通量廣域網(wǎng)能力,提升承載計算任務的數(shù)量,保障海量計算任務高效率、差異化、分布式流通,使能算的多;高性能是指要確保智算中心網(wǎng)絡實現(xiàn)零丟包、無阻塞、低時延運營,保障算得快;高智能則是通過算網(wǎng)大腦實現(xiàn)算力和運力之間協(xié)同編排和調(diào)度,提供算力與連接的融合服務,促進算得優(yōu)。
對于廣域網(wǎng)來說,主要是通過IP+光技術(shù)形成高通量能力,即打造大帶寬、低時延、無損的高通量廣域承載網(wǎng)絡,提供高效靈活算力數(shù)據(jù)傳輸服務。在智算中心網(wǎng)絡中,對網(wǎng)絡性能要求非常高,需使用IB、RoCE等無損電交換技術(shù),同時逐步引入光交換,實現(xiàn)光電融合。此外,智能管控也非常關(guān)鍵,中國聯(lián)通研發(fā)了智算中心管控平臺“智馭”,能夠?qū)崿F(xiàn)算網(wǎng)、光電一體化管理以及智算流量端到端優(yōu)化調(diào)度,并能實時呈現(xiàn)網(wǎng)絡狀態(tài)。
在算網(wǎng)大腦層面,主要是實現(xiàn)算力和連接的協(xié)同編排和智能調(diào)度,提供“算力+連接”的算網(wǎng)融合服務。
唐雄燕表示,光網(wǎng)絡是構(gòu)建AINet“三高”能力的關(guān)鍵底座。AINet部署了雙平面立體組網(wǎng)的400G ROADM全光智算網(wǎng)絡,同時部署了智算網(wǎng)關(guān),實現(xiàn)網(wǎng)絡與智算的高效連接。
針對入算、訓練、推理這三大典型智算業(yè)務場景,去年中國聯(lián)通開展了一些重要實驗。一是海量數(shù)據(jù)入算場景,通過構(gòu)建高通量數(shù)據(jù)網(wǎng)來增大有效帶寬、提高單位帶寬下數(shù)據(jù)傳輸通量,解決低帶寬等不起、高帶寬用不起等問題。二是存算分離拉遠訓練場景,為最大限度地防止數(shù)據(jù)泄露,需要隱私訓練數(shù)據(jù)“不落盤”,進行存算分離拉遠訓練。三是跨DC協(xié)同訓練場景,由于跨DC涉及時延問題,往往難以保障參數(shù)面拉遠下的等效算力。
最后,唐雄燕指出,中國聯(lián)通通過打造算力智聯(lián)網(wǎng)AINet,可為人工智能發(fā)展