
6月30日,華為(wei)宣布開源盤(pan)古70億參(can)數(shu)的(de)稠密模(mo)型和720億參(can)數(shu)的(de)混(hun)合(he)專家模(mo)型(盤(pan)古Pro MoE 72B)。此(ci)外,基(ji)于(yu)昇(sheng)騰(teng)的(de)模(mo)型推(tui)理技(ji)術(shu)也(ye)同步(bu)開源。華為(wei)表示,此(ci)舉(ju)(ju)是華為(wei)踐行昇(sheng)騰(teng)生態戰略的(de)又一(yi)關鍵舉(ju)(ju)措,將推(tui)動大模(mo)型技(ji)術(shu)的(de)研究(jiu)與創(chuang)新發展,加(jia)速推(tui)進人工智能在千行百業的(de)應用與價值創(chuang)造(zao)。
據了解,華為(wei)最新開源的(de)(de)Pro MoE 72B大模型(xing)(xing),在(zai)參數(shu)量僅為(wei)720億,激(ji)活(huo)(huo)160億參數(shu)量的(de)(de)情況下,通過(guo)動態(tai)激(ji)活(huo)(huo)專(zhuan)家網絡的(de)(de)創(chuang)新設計,實現了以小打大的(de)(de)優(you)異性能,甚至可(ke)以媲美千(qian)億級模型(xing)(xing)的(de)(de)性能表現。在(zai)業界權(quan)威大模型(xing)(xing)榜(bang)(bang)單Super CLUE最新公布的(de)(de)2025年5月排行榜(bang)(bang)上,位居千(qian)億參數(shu)量以內大模型(xing)(xing)排行并列(lie)國內第一。
最近一段時間以來,華為公開(kai)了一系列基于(yu)昇騰的大模型技術,讓國內AI開(kai)發者備感期待。
今(jin)年6月20日舉(ju)辦的華(hua)為(wei)開發者大會2025上,華(hua)為(wei)重(zhong)磅(bang)發布了(le)盤(pan)古大模(mo)(mo)型(xing)(xing)5.5。全新(xin)升級(ji)的盤(pan)古大模(mo)(mo)型(xing)(xing)5.5包含了(le)五大基礎模(mo)(mo)型(xing)(xing),分別面(mian)向(xiang)NLP(自然語言(yan)處理(li))、多模(mo)(mo)態、預測、科(ke)學計算、計算機視覺(jue)領域,推動(dong)大模(mo)(mo)型(xing)(xing)成為(wei)行業(ye)數智(zhi)化轉(zhuan)型(xing)(xing)的核心動(dong)力(li)。會上,華(hua)為(wei)還發布了(le)基于Cloud Matrix384超節點的新(xin)一代(dai)昇(sheng)騰AI云(yun)服務,將384顆昇(sheng)騰NPU和192顆鯤鵬(peng)CPU通過(guo)高速網(wang)絡(luo)Matrix Link全對等互聯,形成一臺超級(ji)“AI服務器”,單卡推理(li)吞(tun)吐量躍升到2300Tokens/s,可為(wei)大模(mo)(mo)型(xing)(xing)應用提供“澎湃算力(li)”。
值得注意的(de)(de)(de)是,今(jin)年5月30日,華(hua)為還(huan)重磅(bang)推出參(can)數規(gui)模高達(da)7180億的(de)(de)(de)全新模型(xing)——盤古Ultra MoE。這(zhe)是一(yi)個全流程在昇(sheng)騰(teng)AI計(ji)算(suan)平臺上訓(xun)練(lian)的(de)(de)(de)準(zhun)萬億MoE模型(xing)。同(tong)時(shi),華(hua)為發布盤古Ultra MoE模型(xing)架構和訓(xun)練(lian)方法的(de)(de)(de)技術報告,披露眾多技術細節(jie),充分體(ti)現了昇(sheng)騰(teng)在超大規(gui)模MoE訓(xun)練(lian)性(xing)能(neng)上的(de)(de)(de)跨越。
這一(yi)系(xi)列突破,更為(wei)關鍵的(de)意義在于(yu)(yu),華為(wei)盤(pan)古大(da)模(mo)型(xing)是基于(yu)(yu)昇騰(teng)云(yun)的(de)全棧軟(ruan)硬件(jian)(jian)訓練(lian)(lian)而成(cheng)(cheng)的(de),這標志著(zhu)基于(yu)(yu)昇騰(teng)架構可(ke)(ke)以打(da)造出世界(jie)一(yi)流大(da)模(mo)型(xing)。華為(wei)不僅完成(cheng)(cheng)了國產算力(li)+國產模(mo)型(xing)的(de)全流程自主可(ke)(ke)控(kong)的(de)訓練(lian)(lian)實(shi)踐,同時在集群訓練(lian)(lian)系(xi)統的(de)性能上也實(shi)現了業界(jie)領先,這意味著(zhu)實(shi)現了從(cong)硬件(jian)(jian)到軟(ruan)件(jian)(jian)、從(cong)訓練(lian)(lian)到優化、從(cong)基礎研究到工程落地的(de)“全棧國產化”和(he)“全流程自主可(ke)(ke)控(kong)”的(de)閉環(huan),國產AI基礎設(she)施的(de)自主創(chuang)新能力(li)得到了進(jin)一(yi)步驗證。
此外,與其他大模型(xing)(xing)廠商相比(bi),華為(wei)在(zai)大模型(xing)(xing)戰略上一直獨樹(shu)一幟,強調“不作詩(shi),只(zhi)做事”,堅持(chi)為(wei)千行萬業(ye)“解難題(ti),做難事”,加速千行萬業(ye)智能(neng)化(hua)升級。在(zai)盤(pan)古(gu)(gu)(gu)大模型(xing)(xing)5.5發布(bu)的同時,華為(wei)五(wu)大盤(pan)古(gu)(gu)(gu)行業(ye)思(si)考大模型(xing)(xing)(盤(pan)古(gu)(gu)(gu)醫學、盤(pan)古(gu)(gu)(gu)金融、盤(pan)古(gu)(gu)(gu)政務(wu)、盤(pan)古(gu)(gu)(gu)工業(ye)、盤(pan)古(gu)(gu)(gu)汽車)也同步上線。
華為常務董(dong)事(shi)、華為云計算CEO張平安介紹(shao),在過去(qu)的一年中,盤(pan)古大模型持(chi)續(xu)深耕行(xing)(xing)業,已在30多(duo)個(ge)行(xing)(xing)業、500多(duo)個(ge)場(chang)景中落地(di),在政務、金融、制造(zao)、醫療、煤(mei)礦、鋼鐵、鐵路、自動(dong)駕駛、氣(qi)象(xiang)等領域發(fa)揮巨大價值,重塑千(qian)行(xing)(xing)萬業。
因此,此次(ci)華為(wei)宣(xuan)布開源盤(pan)古70億參數(shu)的稠密模型(xing)和720億參數(shu)的混合專家(jia)模型(xing),一方面有助(zhu)于(yu)更多開發者基于(yu)國產算力平臺開發大模型(xing)技(ji)術,進一步擴(kuo)展昇(sheng)騰(teng)生態;另(ling)一方面在開源的帶(dai)動(dong)下,有助(zhu)于(yu)吸引更多垂直(zhi)行業以盤(pan)古大模型(xing)為(wei)基礎打造智能化解決方案(an),推動(dong)大模型(xing)更廣泛(fan)更深入地賦能千行百(bai)業。