
作者 | 雲鵬
編輯 | 漠影
機器人走貓步引爆行業、舞蹈功夫如人類般絲滑;AI手機一句話訂外賣做報告、懂你所想知你所言;AI PC本地部署模型,打造超級端側智能體給企業提效降本;AI眼鏡智能識物、隨拍隨聊,智能汽車毫秒級實時分析路況……
今天,從AI手機、AI PC、AI穿戴、智能汽車到具身智能,AI從雲端加速走向端側。
端側AI的發展正進入加速演進的新紀元,大模型向多模態方向發展,海量優秀端側模型湧現、快速迭代,模型小型化、垂類化發展趨勢明顯,Agentic AI成為重要趨勢方向。
一系列變化給AI算力側帶來新的挑戰。
端側AI任務從早期單一語音識別發展至複雜環境感知、多模態交互等方向,AI計算工作的規模和複雜性顯著提升,能效優化、安全架構、軟硬件協同、標準化生態構建,諸多問題擺在面前。
端側AI需要的不是單純的算力堆疊,而是效率優先,行業需要一個綜合性、系統性、全局優化且更加靈活、生態兼容性出色的算力底座。
在這樣的趨勢下,異構計算模式成為主流方向,芯片設計正在從「通用計算」向「定製化異構計算」轉變,其中具有獨特優勢的NPU日益成為關鍵支撐部分。

昨日,安謀科技Arm China正式發佈了專為端側大模型而生的最新一代NPU IP——「周易」X3,與Arm架構CPU、GPU協同,組成異構算力「更優解」,直指端側AI落地行業關鍵痛點。

在安謀科技看來,新一代NPU是引領端側AI進化的關鍵。從全面的模型支持、通用的硬件架構、成熟開放的軟件生態、出色的算力帶寬、優化的能效面效到優秀的擴展性和系統一致性,安謀科技給端側AI算力破局提供了「芯」路徑。
一、端側AI時代,NPU成異構算力重要組成,「周易」劍指行業痛點
今天,端側AI的發展勢不可擋,其在響應速度、數據安全、網絡依賴性、運行成本等方面均有明顯優勢,但在端側AI的落地過程中所湧現出的問題和挑戰同樣不容忽視。
計算平臺基礎AI算力不足、存儲帶寬遇到瓶頸、終端設備的電池續航相對有限、散熱空間和散熱能力有限、模型適配同樣不夠完善。
在這樣的背景下,NPU(神經網絡處理器)作為專為AI計算和機器學習而設計的重要計算單元,幾乎已經成為今天各類端側AI設備實現優秀AI體驗的「剛需」,在執行當下主流的端側AI推理任務時,能實現更高計算效率和更好的能效比。
在安謀科技看來,「周易」NPU團隊是驅動創新的核心引擎,NPU也一直是安謀科技的戰略核心產品。
從2018年開始,安謀科技就組建了國內最早的NPU研發團隊之一,目前已經交付了5代NPU,並實現了在終端領域的商業落地,研發團隊在硬件、軟件、工具工具、方案等方面均有技術積累。據稱「周易」NPU的研發和支持100%來自中國本土團隊。

今天,中國無疑是端側AI落地的橋頭堡,擁有着規模最大同時最具增長潛力的市場。我們看到,在AI手機、AI PC、AI眼鏡、智能汽車、具身智能等熱門終端賽道,頭部玩家幾乎均以中國企業佔據主導。
我們看到,安謀科技背靠Arm架構技術與生態系統,將Arm CPU、GPU與安謀科技自研業務產品異構融合,「周易」NPU作為更聚焦國內市場需求的異構計算解決方案,無疑會為國內端側AI落地注入重要驅動力。
二、多年迭代沉澱,「周易」X3揭開面紗,軟硬深度協同是殺手鐧
「周易」NPU歷經多年迭代與技術沉澱,已構建完整的硬件IP和Compass軟件平臺,涵蓋X系列與Z系列的多款產品。此次發佈的「周易」X3,是安謀科技基於對當前技術發展趨勢和行業需求痛點精準研判,對NPU IP的一次重要升級。
具體來看,「周易」X3重點在性能和易用性進行了升級,定位是「專為大模型而生」,採用了最新的DSP+DSA架構,從定點轉向浮點計算,其最核心的特點是通用、靈活、高效、軟硬件緊密協同的計算架構。

新的「周易」X3 NPU IP可以兼顧傳統CNN架構與當下主流的Transformer架構,可以滿足各類端側大模型的計算需求,進而加速Gen AI、Agentic AI與Physical AI在端側的落地。
硬件架構方面,在關鍵性能提升上,「周易」X3單Cluster算力可以支持8-80TFLOPS(FP8),靈活可配,單核心帶寬最高為256GB/s,可以實現更高的數據吞吐量。
帶寬可以說是大模型流暢運行的「生命線」,是影響大模型響應速度與性能的關鍵硬件指標,帶寬能力的大幅提升,其重要性不言而喻。
同時,「周易」X3還支持端側大模型必備的W4A8和W4A16計算加速模式,集成了 安謀科技自研的解壓硬件WDC,可以讓大模型Weight軟件無損壓縮後通過硬件解壓獲得額外約15%的等效帶寬,進而提升計算效率和計算密度。
此外,「周易」X3採用了AI專屬硬件引擎AIFF,配合專用硬化調度器,可以實現低至0.5%的CPU負載和低調度延遲,讓NPU在並行處理多項AI任務時可以更高效,實際AI應用體驗更流暢。
軟件生態方面,「周易」Compass AI軟件平臺可以稱得上是「金牌輔助」,歷經多輪迭代,從各個方面優化了大模型端到端性能,提供統一的端到端工具鏈支持全系列「周易」NPU。

目前Compass AI軟件平臺已經兼容了TensorFlow、ONNX、Pytorch等主流AI框架,有着出色的大模型動態Shape支持能力,同時支持GPTQ等大模型主流量化方案、Hugging Face模型庫,以及LLM、VLM、VLA、MoE等多種類型的模型。
在模型支持方面,「周易」X3支持的算子數量超過160個、支持的模型數量超過270個。在Compass AI軟件平臺的加持下,開發門檻顯著降低,進一步加速「周易」NPU生態的擴展。
面向廣大開發者,Compass AI平臺可以提供先進的量化和性能優化算法,讓開發者充分優化精度和性能。同時,平臺支持用戶模型和自定義算子等開發和調試,以及賦能客戶進行產品差異化設計,這些能力均與當下開發者的關鍵訴求相一致。
總體來看,軟硬技術深度協同是「周易」X3的核心優勢,其CNN模型性能相較上一代提升了30-50%。基於對各類大模型推理進行深度優化,「周易」X3在相同算力規格下,AIGC大模型能力提升了10倍左右。
其多核算力線性度可以達到70-80%,大模型Prefill階段算力利用率提升至72%,Decode階段有效帶寬利用率在開啓安謀科技自研的解壓引擎WDC情況下超過100%,可以更充分地釋放硬件算力潛力。
可以說,「周易」X3給端側AI計算效率立了一個新的標杆。
三、從AI手機、AI PC到智能座艙、具身智能,「周易」NPU生態迸發巨大潛力
此次在發佈會現場的Demo展區,我們看到基於「周易」NPU IP實現的諸多場景化落地解決方案,優秀的端側AI體驗,正加速走向現實。
從「周易」Z1的AI人臉識別、AI物體識別、AI語音識別到「周易」Z2的圖像超分辨率優化、智能座艙應用,再到「周易」X1的AI圖像降噪、「周易」X2的文生圖、文搜圖AI應用,我們看到「周易」系列NPU是持續迭代的,是能夠「進化」的,與技術發展緊密同步,與行業需求緊密結合。

這次在「周易」X3上,我們看到其在多模態方面的諸多AI應用,比如在當下業內大火的AI視覺識物、AI讀懂世界方面,基於「周易」X3,AI PC本地運行MinicpM v2.6模型,可以實現隨時拍照隨時識圖,AI快速圖解各類事物。

從現場演示案例來看,AI對照片的描述是具體準確的,可以給出「日落時寧靜的海灘景色」這類描述,甚至可以讀出圖中的一些「氣氛」、「意境」,對於沙灘、海浪和一些景物紋理、形狀都可以有比較具體的描述。
在經典的文生圖應用方面,基於「周易」X3,AI PC本地運行Stable Diffusion v1.5,可以實現流暢高質量的端側文生圖,從演示案例來看,圖片的清晰度不錯,同時生成速度僅為「秒級」,AI可以幫助創作者更高效地將創意想法變為現實。
在基礎的文生文應用中,我們看到「周易」X3可以支持端側運行DeepSeek-R1-Distill-Qwen-1.5B,AI對話的流暢度、tokens生成速度都有比較明顯的提升。
整體來看,相比前代產品,X3在性能方面的大幅提升以及生態方面的出色支持,帶來的最直觀效果就是AI應用實際體驗的流暢度大幅提升,「又快又好」成為常態。
今天我們在現場看到的演示只是「冰山一角」,從加速卡、AI PC、AI手機、具身智能、智能座艙、ADAS(高級駕駛輔助系統)到智能IPC等終端,聚焦端側各類場景的「周易」X3 NPU IP已經可以覆蓋基礎設施、智能汽車、移動終端、智能物聯等領域。

展望未來,隨着AI行業發展,NPU潛力正愈發凸顯。Agentic AI快速發展、物理AI嶄露頭角,AI沿着這些重要路徑快速發展,端側AI領域湧現出諸多新藍海。
安謀科技提到,未來其「周易」NPU產品將繼續迭代,當前計算架構持續演進,更高效的通用計算能力、更強的計算擴展能力、更多的數據格式支持、更高效的軟件使用界面都將是後續NPU架構未來演進的方向。

雖然技術發展的趨勢和方向在不斷調整,但性能、能效、時延、安全、成本等核心命題的重要性仍然不會變。
正如安謀科技所提到的,他們「要在不確定性中尋找確定性」,比如在低比特量化、浮點運算等方向持續推動,在提升產品核心能力的基礎上,保持產品出色的靈活性,以應對複雜的行業挑戰和客戶對靈活性的高要求。
可以看到,今天的「周易」NPU基於自身獨特優勢,面向端側AI加速落地的未來展現出巨大潛力。
結語:前瞻性佈局端側AI,安謀科技用技術和生態領跑行業
今天,端側AI的浪潮正在重塑人機交互的未來,推動「千人千面」的實時智能深入千行百業。從計算IP、開源軟件棧、工具鏈到算法優化,安謀科技有着Arm全棧技術生態支撐,加之自身出色技術創新能力,賦能國內芯片賽道玩家抓住端側AI機遇。
專為端側大模型設計的安謀科技「周易」X3,憑藉其專用化設計與軟硬件協同優化能力,給端側AI應用體驗帶來了一次躍遷升級,無疑將成為推動行業變革的核心技術底座。
多年來,安謀科技一直專注於核心IP設計,進行前瞻佈局,解決客戶自研AI芯片的關鍵痛點。目前安謀科技的核心戰略發展方向已經很明確,就是全力「All in AI」。

值得一提的是,從多年來的技術和產品佈局來看,安謀科技對AI的全力以赴並非是追熱點,而是一種長期主義的堅持,做「正確但困難」的事情。在今天的中國,有這樣一羣工程師,正「以硅為筆,以夢為墨」,書寫着中國智能計算的新故事。