國產(chǎn)GPU力挺!摩爾線程宣布支持阿里Qwen3全系模型

日前,阿里巴巴發(fā)布并開源新一代通義千問模型 Qwen3,參數(shù)量僅為 DeepSeek-R1 的 1/3,成本大幅下降,性能則全面超越 DeepSeek-R1、OpenAI-o1 等全球頂尖模型,登頂全球最強(qiáng)開源模型。

Qwen3 發(fā)布當(dāng)天,摩爾線程宣布,其率先完成了 Qwen3 全系列模型在全功能 GPU 上的高效支持。摩爾線程表示,這一成果充分驗(yàn)證了 MUSA 架構(gòu)和全功能 GPU 的技術(shù)成熟度與可靠性。

目前,主流推理引擎均可基于摩爾線程 MUSA 平臺運(yùn)行 Qwen3 系列模型。摩爾線程稱,MUSA 平臺能夠作為 vLLM、Ollama、GPU Stack 等各類主流開源推理引擎的后端,為 Qwen3 系列模型的高效運(yùn)行提供強(qiáng)大動(dòng)力。

例如,QWen3-235B-A22B(Qwen3 系列最大參數(shù)量模型),基于 vLLM-MUSA 引擎在摩爾線程全功能 GPU 上穩(wěn)定運(yùn)行。

據(jù)了解,此次開源的兩款 MoE 模型是 Qwen3-235B-A22B 和 Qwen3-30B-A3B;同時(shí)還包括六個(gè) Dense 模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費(fèi)領(lǐng)取以下5G精品資料

本周熱點(diǎn)本月熱點(diǎn)

 

  最熱通信招聘

業(yè)界最新資訊


  最新招聘信息