在全球AI算力競(jìng)爭(zhēng)進(jìn)入深水區(qū)、技術(shù)代際更替加速演進(jìn)的當(dāng)下,華為正在調(diào)整敘事重心:從產(chǎn)品性能的“點(diǎn)式突破”,轉(zhuǎn)向生態(tài)建設(shè)的“系統(tǒng)性投入”。
9月20日,在華為全聯(lián)接大會(huì)2025(HC2025)上,華為常務(wù)董事汪濤指出,繁榮的生態(tài),不僅是產(chǎn)業(yè)前行的核心引擎,更是支撐華為長期增長的戰(zhàn)略基石。會(huì)上,“開放、合作、共贏”也成為他反復(fù)強(qiáng)調(diào)的關(guān)鍵詞。
同時(shí),在這場(chǎng)被視作昇騰“亮劍”的大會(huì)上,昇騰計(jì)算業(yè)務(wù)總裁張迪煊宣布成立CANN技術(shù)指導(dǎo)委員會(huì),并承諾每年投入1500P算力和3萬開發(fā)板,支持全球開發(fā)者共建共創(chuàng)。不同于以往單點(diǎn)性能的比拼,這一次華為選擇押注全棧開源與硬件開放,把工具鏈、編譯器、框架全面交到開發(fā)者手中,也將模組、標(biāo)卡、超節(jié)點(diǎn)開放出來,意在夯實(shí)AI產(chǎn)業(yè)的算力底座。

對(duì)華為而言,這不僅是技術(shù)路線的延續(xù),更是從“補(bǔ)齊短板”到“主動(dòng)建新路”的轉(zhuǎn)變:不僅要在全球AI格局中找到屬于中國的競(jìng)爭(zhēng)力,也要與全球開發(fā)者一起,去定義新標(biāo)準(zhǔn)、開創(chuàng)新范式。

開源先行,共建社區(qū)新局面
過去,昇騰的核心軟件棧CANN更多由華為內(nèi)部主導(dǎo)研發(fā)和維護(hù),對(duì)外開放有限,開發(fā)者要想深度參與并不容易。而這一次,華為明確提出計(jì)劃在年底前完成CANN全棧的開源。這意味著,從編譯器到算子庫、從運(yùn)行時(shí)到底層接口,開發(fā)者都可以自由調(diào)用、調(diào)優(yōu)甚至改造。
這種變化不只是一個(gè)口號(hào),而是架構(gòu)層面的根本性調(diào)整。通過分層解耦,CANN將支持開發(fā)者按需調(diào)用模型、算子、內(nèi)核甚至底層資源。對(duì)于希望深入優(yōu)化性能的“發(fā)燒友”,華為還開放了底層Runtime能力,讓他們能夠細(xì)粒度調(diào)度硬件資源,挖掘出潛在的極致算力。這一轉(zhuǎn)變,直接響應(yīng)了開發(fā)者長期以來對(duì)靈活性、透明度和兼容性的訴求。
與此同時(shí),CANN也在逐步構(gòu)建一套完備的編程體系。開發(fā)者既可以使用Ascend C語言與CATLASS模板庫實(shí)現(xiàn)自定義開發(fā),也可以通過對(duì)接Triton、TileLang等Python前端框架快速驗(yàn)證新想法。華為還開放了共享存儲(chǔ)能力,使片上內(nèi)存可以實(shí)現(xiàn)資源池化,開發(fā)者通過SHMEM接口開發(fā)算子,通信延遲顯著降低,代碼量減少60%。下一代產(chǎn)品還將引入CCU集合通信加速單元,把部分歸約計(jì)算卸載到專用硬件上,進(jìn)一步釋放算力潛能。
在基礎(chǔ)能力之外,昇騰也貢獻(xiàn)了新的計(jì)算標(biāo)準(zhǔn)與工具。華為創(chuàng)新了HiFloat8低精度數(shù)據(jù)格式,并捐獻(xiàn)給全球計(jì)算聯(lián)盟(GCC)推動(dòng)標(biāo)準(zhǔn)化,在保持接近FP16精度的同時(shí),顯著降低了顯存占用,為大模型訓(xùn)練和推理提供更高性價(jià)比的方案。工具鏈方面,華為開源了自動(dòng)調(diào)優(yōu)工具msProfiler,能夠根據(jù)輸入?yún)?shù)自動(dòng)生成最優(yōu)Tiling策略,算子開發(fā)效率提升20倍以上。在推理優(yōu)化中,Attention與FFN分離方案通過靈衢互聯(lián)實(shí)現(xiàn)大帶寬低時(shí)延,實(shí)測(cè)性能提升超過50%,相關(guān)代碼已開源到vLLM社區(qū)并持續(xù)迭代。
全面開源帶來的價(jià)值,目前已經(jīng)在業(yè)界初步得到驗(yàn)證。上海人工智能實(shí)驗(yàn)室國產(chǎn)編譯首席研究員袁晟,基于CANN開源的編譯器組件AscendNPU IR,開發(fā)了Triton擴(kuò)展深度學(xué)習(xí)編譯器DLCompiler。該編譯器通過跨架構(gòu)DSL擴(kuò)展與智能自動(dòng)優(yōu)化技術(shù),大幅提升了開發(fā)效率與運(yùn)行性能。在MLIR編譯階段,DLCompiler與AscendNPU IR深度對(duì)接,充分利用了其底層表達(dá)能力,從而讓Triton算子在昇騰硬件上實(shí)現(xiàn)高效性能優(yōu)化。
透過現(xiàn)象看本質(zhì),開源不僅是“代碼共享”,更是技術(shù)創(chuàng)新的加速器。而對(duì)于華為而言,全面開源或許只是第一步,更重要的是如何融入全球開發(fā)者生態(tài)。張迪煊提到,昇騰將優(yōu)先支持Triton、PyTorch等主流開源框架,并把最新功能第一時(shí)間開放到社區(qū)。
多個(gè)國際社區(qū)中,昇騰的新特性和組件已與主流框架同步上線,讓開發(fā)者能夠在第一時(shí)間獲取并測(cè)試最新技術(shù)。據(jù)了解,當(dāng)前昇騰主導(dǎo)或深度參與的開源項(xiàng)目超過60個(gè),累計(jì)貢獻(xiàn)37萬行代碼,活躍開發(fā)者數(shù)量超過6500人。
另外,在大會(huì)期間CANN技術(shù)指導(dǎo)委員會(huì)正式成立,這標(biāo)志著昇騰軟件棧的管理將從“公司主導(dǎo)的項(xiàng)目制”走向“社區(qū)化共治”。這一模式下,開發(fā)者不再只是工具的使用者,而是通過議題討論、代碼貢獻(xiàn)、規(guī)則制定,成為生態(tài)演進(jìn)的共同塑造者。
大會(huì)上,華為承諾每年投入1500P算力和3萬片開發(fā)板,面向全球開發(fā)者開放使用。通過算力和硬件的長期供給,開發(fā)者不僅可以快速驗(yàn)證和迭代自己的想法,還能在低成本環(huán)境中探索創(chuàng)新路徑。這種大規(guī)模資源投入,實(shí)際上為昇騰生態(tài)構(gòu)建了一個(gè)持續(xù)的“飛輪效應(yīng)”:越多開發(fā)者加入,生態(tài)越豐富;生態(tài)越豐富,昇騰的技術(shù)壁壘和市場(chǎng)吸引力就越強(qiáng)。

硬件開放,打造全場(chǎng)景堅(jiān)實(shí)算力底座
如果說全面開源為昇騰生態(tài)鋪設(shè)了“軟件高速公路”,那么硬件開放則是在夯實(shí)算力的“地基”。張迪煊在演講中強(qiáng)調(diào),昇騰不僅要在軟件層面做到開放透明,還要在硬件環(huán)節(jié)徹底打破壁壘,把模組、標(biāo)卡、互聯(lián)協(xié)議交到伙伴手中,讓更多廠商能夠在此基礎(chǔ)上打造差異化產(chǎn)品。
其中,靈衢協(xié)議的價(jià)值尤其關(guān)鍵。在大模型時(shí)代,超節(jié)點(diǎn)需要多個(gè)算力單元的高速互聯(lián)。傳統(tǒng)方案往往受限于帶寬和時(shí)延,導(dǎo)致算力利用率不足。基于靈衢互聯(lián)協(xié)議,華為開創(chuàng)了超節(jié)點(diǎn)架構(gòu),其具備資源池化、規(guī)模擴(kuò)展、長穩(wěn)可靠的關(guān)鍵特性,可實(shí)現(xiàn)計(jì)算、存儲(chǔ)單元的大帶寬和低時(shí)延互聯(lián),通過統(tǒng)一協(xié)議和內(nèi)存編址,使有效算力能夠隨集群規(guī)模線性擴(kuò)展,并大幅提升集群可靠性。
在華為給全球AI注入的“猛藥”中,硬件開放也并不是抽象的概念,而是在產(chǎn)品迭代中有了更具象的體現(xiàn)。今年,昇騰已經(jīng)推出了大模型推理標(biāo)卡,支持伙伴開發(fā)面向垂直場(chǎng)景的一體機(jī)。并且公布了明年的產(chǎn)品節(jié)奏:Atlas 350標(biāo)卡、Atlas 550模組和刀片服務(wù)器即將上市。
據(jù)介紹,Atlas 350標(biāo)卡,采用最新的昇騰950PR芯片,向量算力提升2倍,支持更細(xì)粒度的Cacheline訪問,在推薦推理場(chǎng)景可實(shí)現(xiàn)2.5倍性能提升,且單卡即可運(yùn)行。Atlas 350支持4個(gè)靈衢端口互聯(lián),實(shí)現(xiàn)算力、內(nèi)存等資源池化,可以讓更大參數(shù)模型、更低時(shí)延應(yīng)用可以在標(biāo)卡上實(shí)現(xiàn)。
實(shí)際上,硬件能力的釋放也正在通過行業(yè)方案,與產(chǎn)業(yè)界共享技術(shù)紅利。目前,華為已經(jīng)聯(lián)合20多家ISV伙伴,基于昇騰平臺(tái)打造行業(yè)解決方案,比如在金融場(chǎng)景中,基于昇騰平臺(tái)的信貸報(bào)告系統(tǒng),能夠在保障數(shù)據(jù)安全的前提下顯著提升處理效率;在醫(yī)療場(chǎng)景中,電子病歷與教學(xué)助手的應(yīng)用已經(jīng)進(jìn)入試點(diǎn),為醫(yī)生提供更快速的信息檢索與輔助決策;在電力行業(yè),算力平臺(tái)則支撐了電網(wǎng)調(diào)度優(yōu)化,幫助提升運(yùn)行穩(wěn)定性。
未來,隨著更多伙伴的加入,這種模式或許將加速AI應(yīng)用在千行百業(yè)的滲透。大會(huì)現(xiàn)場(chǎng),張迪煊也呼吁道,“誠摯歡迎更多ISV加入,共同挖掘新場(chǎng)景、新機(jī)會(huì),讓AI走深向?qū)崳悄軣o所不及。”
一手硬件開放,一手軟件開源,前者提供物理層面的支撐,后者塑造了創(chuàng)新的通道。兩者疊加,無疑讓昇騰在體系化能力上,建立起新的優(yōu)勢(shì)。

全球化與人才培養(yǎng)并進(jìn),驅(qū)動(dòng)生態(tài)的可持續(xù)力量
生態(tài)的繁榮不僅依賴于開源和硬件開放,同樣需要長期的人才培養(yǎng)與國際化布局作為支撐。自2020年起,華為與教育部合作推動(dòng)“智能基座”計(jì)劃,把昇騰課程引入高校課堂,逐步形成覆蓋本科、碩博不同階段的培養(yǎng)體系。
這幾年,華為不僅推動(dòng)了普適性的教學(xué)內(nèi)容,還與頭部高校成立鯤鵬昇騰卓越中心和孵化中心,圍繞編譯、算子優(yōu)化、推理加速等關(guān)鍵方向開展科研課題。大力地投入,也讓華為看到了階段性的成果。比如,北京大學(xué)楊智團(tuán)隊(duì)自研的TileLang編程語言,通過類Python的編程方式大幅降低了AI編程門檻,與昇騰CANN完成對(duì)接后,能用不到原始代碼六分之一的篇幅實(shí)現(xiàn)FlashAttention算子,性能依舊保持在主流水準(zhǔn)。
又如,基于昇思MindSpore框架,巴黎文理大學(xué)高等礦業(yè)學(xué)院正在探索降維壓縮技術(shù),在減少10倍KV-Cache內(nèi)存消耗的同時(shí),將精度損失控制在0.1%以內(nèi)。這些案例表明,科研與人才培養(yǎng)正在與產(chǎn)業(yè)生態(tài)形成正向循環(huán):新方法推動(dòng)性能優(yōu)化,而生態(tài)平臺(tái)則為研究成果的落地提供舞臺(tái)。
在全球化方面,華為正嘗試讓昇騰生態(tài)逐步進(jìn)入海外市場(chǎng)。不同于以往以產(chǎn)品出口為主的路徑,這一次,華為更多通過開放代碼、工具鏈與標(biāo)準(zhǔn),把昇騰嵌入國際開源社區(qū),從而實(shí)現(xiàn)“生態(tài)先行”。昇騰也在多個(gè)國際社區(qū)同步發(fā)布新特性,讓海外開發(fā)者可以第一時(shí)間接觸到昇騰的能力。
同時(shí),華為也在與海外高校和科研機(jī)構(gòu)建立合作,從聯(lián)合實(shí)驗(yàn)室到人才培養(yǎng)計(jì)劃,逐步形成更穩(wěn)固的國際化網(wǎng)絡(luò)。對(duì)于產(chǎn)業(yè)伙伴而言,這種開放姿態(tài)降低了試水成本,讓他們能夠在已有生態(tài)框架下嘗試使用昇騰,而不必?fù)?dān)心兼容性問題。
過去幾年,華為在壓力與競(jìng)爭(zhēng)中一次次選擇“另辟蹊徑”:從操作系統(tǒng)到自研光器件,再到今天的昇騰生態(tài),都體現(xiàn)出“補(bǔ)齊短板”之外的另一種路徑——主動(dòng)建新路。
這條路不是簡(jiǎn)單的產(chǎn)品堆疊,而是由一系列系統(tǒng)性舉措構(gòu)成:全面開源,讓工具鏈、編譯器與算子庫真正走向社區(qū);硬件開放,把模組、標(biāo)卡和互聯(lián)協(xié)議交給伙伴,構(gòu)建全場(chǎng)景算力底座;人才培養(yǎng)與全球化布局,為生態(tài)提供源源不斷的創(chuàng)新活力與應(yīng)用空間。
正是在這些行動(dòng)的支撐下,昇騰不再只是華為的一個(gè)產(chǎn)品線,而正在成為開發(fā)者、產(chǎn)業(yè)伙伴乃至科研機(jī)構(gòu)共同參與的開放平臺(tái)。它的意義,或許不只是中國AI產(chǎn)業(yè)在全球競(jìng)爭(zhēng)中的一次突圍,更可能是未來生態(tài)競(jìng)爭(zhēng)格局中的一次提前布局。正如張迪煊在演講最后所說,別再只做“使用者”和“適配者”,要成為“定義者” 和“開創(chuàng)者”。