ICC訊 中興通訊產品規劃首席科學家王衛斌在2024 WAIC的AI創新生態論壇發表了題為《AI進階,開啟極智算網新未來》的演講,闡述了中興通訊在智算領域的核心理念和戰略布局。
王衛斌強調,近一年來,全球大模型和生成式AI技術突破層出不窮,智能計算的發展進入快車道,AI將從1.0進階到2.0。相較于AI 1.0,從技術上看,AI 2.0階段的大模型將從千億進化到萬億甚至數十萬億,與此對應,AI基礎設施從千卡集群發展到了萬卡甚至超萬卡集群,同時也在探索異構集群和長距互聯集群的可行性。但是,談及AI 2.0更多地是指構建AI產業開放生態和商業成功所面臨的新挑戰,包括:從單純的大模型訓練競賽向模型推理應用落地、使能千行百業的轉變;從性能優先、價格昂貴的集群系統向性價比優先、人人用得起的普惠算力轉變;從多而不強、自成一體的碎片化封閉生態向取長補短、多方協同的開放創新生態轉變。
面對AI進階新挑戰,王衛斌表示中興通訊將堅持開放解耦原則,通過“開放基座、以網強算、訓推并舉、多方合作”的核心理念與產業鏈合作伙伴共同構建一個開放的智算生態。
首先是構建一個開放的“智算基座”,與主流GPU廠商緊密合作,提供高性能和多樣化的算力解決方案。該方案不僅實現了“換芯不換座”的目標,還可以讓用戶根據不同場景選擇合適算力,加速AI算力的創新,實現共贏的商業生態。
其次是基于“以網強算”理念打造高效超萬卡集群。針對單卡算力受限和機內卡間互聯瓶頸引入了Olink開放交換互聯的創新突破,這不僅推動了機內通信從點對點全網狀互聯向交換互聯的轉變,還支持單機更大規模的GPU部署。針對超大規模GPU服務器帶寬和擁塞瓶頸,推出超萬卡星云網絡高速互聯技術,通過大容量交換和400G接口及IGLB全局流控技術實現超萬卡互聯和端網協同,極大提升了集群算力的使用效率。
再次是采取“訓推并舉”策略,支持異構GPU混池訓練,避免了對單一算力的依賴。在推理方面,支持多場景、多規格的推理卡,實現了推理任務的智能分發,為不同的推理任務選擇了性價比最高的推理卡。此外,通過提供遷移工具,支持訓練和推理在不同場景GPU之間的快速遷移,進一步降低了推理成本。
最后是積極推進“多方合作”,催熟AI產業生態。中興通訊與業界主流廠家合作,共同打造ZTE Cloud AI開放實驗室,實現多廠商互操作性測試、系統集成、創新方案驗證和技術標準化;同時與多家業界主流模型合作,構建多場景系列化AI應用一體機,集成了開放模型倉庫和多場景應用,支持多模型入駐模型和應用靈活適配。這使得最終客戶可以根據自己的需求,靈活選擇不同模型,打造場景化應用。
王衛斌表示,未來AI技術和產業將持續進階迭代,中興通訊始終秉持開放共贏的理念,攜手合作伙伴共同構建多元化智算發展新生態,共贏AI新未來。