近日,上海人工智能實驗室推出DeepLink多元算力混合推理加速方案(以下簡稱「DeepLink混推方案」),首次實現對壁仞科技等四家國產算力廠商多款芯片的混合調度與協同推理。
DeepLink混推方案的發布,既為全國智能算力互聯互通、高效盤活分散算力資源探索出新路徑,也為「人工智能+」行動落地提供穩定、靈活、高效、低成本的算力支撐。
在傳統大模型推理架構中,在單一芯片集羣的PD分離推理策略,已成為業界主流推理優化應用方向。然而,面向國產異構芯片的協同推理,仍是當前行業亟待攻克的關鍵難題。本次,上海人工智能實驗室推出的方案,為激活多元國產算力生態提供了新模式。
基於統一推理中間件、低時延通信、智能流量路由、策略求解器等原創技術,DeepLink混推方案具有精準匹配算力密集型、訪存密集型硬件的能力,並同時兼顧推理時延與吞吐性能。另外,該方案還具備良好的可擴展性,能有效地應用於Attention-FFN(AF)分離等其他場景。
在此基礎上,DeepLink 混推方案首次實現包括壁仞科技等四家廠商在內的多款國產芯片的深度混合調度與協同推理,並完成國產異構芯片「1+1>2」的效能躍升。
壁仞科技秉持 「技術開放、產業協同、標準共建」 理念,在異構混訓、異構混推等異構算力關鍵技術領域深入探索,推動多元算力高效融通。2024年底,壁仞科技在業界首次實現四種異構芯片混合訓練,隨後在人工智能產業工委會的推動下,牽頭成立智算集羣異構混訓工作組,並在全國信標委主導下制定異構混訓國家標準,深度參與DeepLink跨域混訓合作;2025年世界人工智能大會期間,壁仞科技再度取得突破,首次實現基於壁仞科技、英偉達等多款芯片異構算力混推,與中國電信聯合發布異構算力協同白皮書。今年,壁仞科技與上海人工智能實驗室合作進一步深化,推出全新的DeepLink混推方案。
值得關注的是,壁仞科技與上海人工智能實驗室聯合發起並牽頭推進異構混推標準制定工作,打造技術攻關、應用落地、標準引領閉環,以實際行動響應落實2026年初工信部等八部門聯合印發《「人工智能+製造「專項行動實施意見》中提出的加快突破異構算力等關鍵技術的工作,共建異構算力開放生態,支持多元算力高效落地,為人工智能產業築牢堅實算力底座。