2 月 8 日,在中國移動的助力下,中國石油高效完成 DeepSeek V3/R1 全棧國產(chǎn)化的訓(xùn)推適配和私有化部署。此次部署,基于 DeepSeek 的關(guān)鍵技術(shù)點,開展了系列基礎(chǔ)模型算法創(chuàng)新,實現(xiàn)了從底層芯片到框架、模型的全棧自主可控,為推動人工智能技術(shù)在能源化工領(lǐng)域的深度應(yīng)用與國產(chǎn) AI 技術(shù)生態(tài)的規(guī)模化落地注入了強大動力。
一直以來,中國移動與中國石油兩大央企積極響應(yīng)國家人工智能戰(zhàn)略,努力推動“人工智能+”在能源化工行業(yè)落地生根。此前,中國移動攜手中國石油發(fā)布能源化工領(lǐng)域首個行業(yè)大模型——700 億參數(shù)昆侖大模型,助力中國石油打造“五個一”:建設(shè)一個央企領(lǐng)先的算力中心,一個集中統(tǒng)一 AI 中臺,一套高質(zhì)量行業(yè)數(shù)據(jù)集,一套國內(nèi)領(lǐng)先的行業(yè)大模型、一系列創(chuàng)新應(yīng)用。
面對中國石油多模態(tài)、超百億參數(shù)的大模型訓(xùn)練任務(wù)需求,移動云憑借強大的算力網(wǎng)絡(luò)能力,實現(xiàn)了資源的快速響應(yīng)、彈性擴展及高質(zhì)量供給。通過為中國石油構(gòu)建“算力泛在、算網(wǎng)共生、智能敏捷、安全可靠、綠色低碳”的一體化算力體系,移動云已提供超過 1000P 的穩(wěn)定算力資源,為大模型的建設(shè)和運行提供了堅實的算力保障。
為了使 DeepSeek 系列模型在昆侖大模型原有的框架下,獲得更好的適配效果和執(zhí)行性能,中國移動第一時間開展相關(guān)的分析、適配與創(chuàng)新工作。中國移動通過配置化開發(fā),在 DeepSeek V3 模型基礎(chǔ)上快速實現(xiàn)了自定義模型參數(shù)和規(guī)模的針對性優(yōu)化。團隊在不實際啟動集群訓(xùn)練任務(wù)的情況下,僅通過單卡即模擬出集群中所有卡的內(nèi)存占用情況,從而制定整體的集群分布式訓(xùn)練策略。
中國移動復(fù)現(xiàn)并優(yōu)化了 DeepSeek MTP 多 Tokens 預(yù)測功能,通過 DeepSeek-V3/R1 主模型和 MTP Module 的分布式調(diào)度,實現(xiàn)一次解碼生成多個 Token,并通過使整圖編譯功能,組合計算圖的通用算子,實現(xiàn)自動融合加速,提升 DeepSeek-V3/R1 端到端的推理性能。
此次 DeepSeek 大模型的成功部署,為中國政企客戶實現(xiàn) DeepSeek V3/R1 全棧國產(chǎn)化的訓(xùn)推適配和部署提供了重要參考。它也為中國石油昆侖大模型優(yōu)化應(yīng)用效果、縮短研發(fā)周期、構(gòu)建健康生態(tài)提供了新引擎,推動“數(shù)智中國石油”建設(shè)步入快車道。
在應(yīng)用層面,昆侖大模型的問答應(yīng)用“行業(yè)大家”目前已新增 DeepSeek 深度推理能力。用戶在使用該應(yīng)用時,除了可以得到昆侖大模型生成的能源化工領(lǐng)域?qū)I(yè)問答結(jié)果,還能選擇“深度思考”模式,體驗知識推理、場景理解等 AI 服務(wù)。
在模型層面,昆侖大模型的 AI 中臺模型廣場目前已上線 DeepSeek-V3 與 DeepSeek-R1 模型版本,并實現(xiàn)全尺寸適配,用戶可基于 AI 中臺調(diào)用 DeepSeek 模型