伴隨阿里巴巴通義實驗室發佈Qwen3-VL中小尺寸模型,英特爾今日宣佈已在Day 0完成了針對該模型的適配,並實現對近期發佈的Qwen3-Next模型的高效部署。全新模型在搭載英特爾®酷睿™Ultra處理器的AI PC上均展現了流暢的運行表現,充分發揮其CPU、GPU、NPU的XPU架構優勢,並帶來優異的系統性能提升和流暢的用戶體驗。這也彰顯了英特爾致力於持續賦能AI技術創新、積極推動模型生態合作的承諾。
本次英特爾與阿里通義實驗室聯合發佈成果主要亮點
●英特爾 Day 0優化Qwen3-VL MOE,多輪對話賦能AI PC更強理解力
●英特爾AI PC部署Qwen3-Next-80B-A3B大模型, 解鎖更多端側智能體新應用
●英特爾客戶端事業部和通義實驗室聯合發起「端側AI創新挑戰賽」,加速Qwen模型落地AI PC
全新發布的Qwen3-VL系列模型在顯著提升視覺理解能力的同時,還保持了強大的純文本處理能力,在複雜多模態任務中能夠展現出卓越性能。這是在Qwen3-Next系列模型亮相後的又一次創新發布。英特爾的XPU架構和硬件特性,高度適配日趨複雜的模型結構,可將模型的鏈路(pipeline)進行混合部署,在引入NPU加速模型推理的加持下,能夠實現高性能、高性價比和高可擴展性的端側部署。模型加硬件的創新能力,拓展了更多應用場景,讓智能體多輪對話、長上下文窗口、增強的AI PC多模態感知能力和交互能力得以充分施展,進一步縮短了AI PC的願景與現實之間的距離。
英特爾Day0優化Qwen3-VL MOE,多輪對話賦能AI PC更強理解力
近期開源的Qwen3-VL-235B-A22B系列模型,將視覺語言模型(VLM)的性能推上了新高度。Qwen3-VL大幅提升了視覺Agent、視覺編程和空間感知等關鍵能力,不僅可調用摳圖、搜索等工具完成「帶圖推理」,也可以憑藉一張設計草圖或一段小遊戲視頻直接「視覺編程」,所見即所得地復刻圖表、網頁和複雜程序。在開發者期待之中,我們迎來了適合端側部署的Qwen3-VL-30B-A3B模型。
目前,英特爾酷睿Ultra平臺已經實現了針對Qwen3-VL-30B-A3B模型的優化部署。通過優化算法,開發者可以在大參數量的模型推理過程中,避免重複計算,進而提升多輪對話的推理效率。在典型的輸入場景下,吞吐量可以達到28tps。這使開發者可以充分發揮模型的agent能力,構建複雜的使用場景,同時保證優異流暢的運行效果,這也將有助於解鎖更豐富的應用場景。
下面的視頻展示的就是用Qwen3-VL-30B-A3B模型來實現的多圖片識別、多輪對話總結分析的智能體應用。
英特爾AI PC部署Qwen3-Next大模型,解鎖更多端側智能體新應用
Qwen3-Next-80B-A3B的創新架構,在大幅降低訓練和推理成本的同時,實現了接近甚至超越更大規模模型的性能,模型的長文本能力進一步提升,滿足更復雜的智能體應用需求。
其中對長上下文能力提升起到重要作用的Gated DeltaNet算子,可以被基於Xe架構的英特爾GPU和NPU平臺原生支持,這體現了英特爾XPU硬件路線圖的戰略佈局, 以及原生支持大模型架構的發展趨勢。
現在,80B大模型已不再是雲端專屬。Qwen3-Next-80B-A3B模型已經高效部署在基於英特爾酷睿 Ultra 200系列處理器AI PC的 iGPU上。在32K長上下文的任務場景下,吞吐量可以達到23.43tps,是Qwen3-32B的十倍。
同時,得益於推理性能和模型能力的提升,AI PC 上所搭載的智能體應用場景也更為多樣,能夠更高效地應對複雜任務需求。以下示例展示了基於Qwen3-Next-80B-A3B模型構建的智能體,基於一個包含三萬六千字、《紅樓夢》前五回的長文本,完成內容理解、情節續寫、人物關係梳理,並最終自動生成演示文稿的全流程效果。
Qwen3-Next-80B-A3B 10倍推理效率提升
Qwen4-Next-80B-A3B Agentic workflow
軟硬兼修是英特爾發力AI的大局觀。英特爾酷睿Ultra系列處理器奠定了本地AI創新的算力基石,加速了AI技術的普及與落地。而諸如OpenVINO的軟件生態則確保了AI模型與下一代Panther Lake AI PC平臺的原生兼容性,實現了從「當前平臺」到「未來平臺」的平滑過渡與「即開即用」的流暢性能。
AI 的未來,根植於模型創新與軟硬件生態的協同,更得益於廣大社區和開發者的共創活力。基於此,阿里通義實驗室和英特爾客戶端事業部強強聯手,在模型Day 0成功合作的基礎上,聯合發起「端側AI創新挑戰賽」,此舉標誌着雙方合作從模型與硬件的深度適配,邁向推動技術普惠與生態繁榮的新階段,旨在為開發者提供強大支撐,加速其應用創新與商業落地進程。
英特爾通過硬件平臺、軟件工具與生態網絡的深度協同,實現對新模型的Day 0適配,不僅加速了技術到應用的轉化,更推動着整個 AI 產業的高效創新。未來,英特爾將持續深化與合作伙伴的協同,讓 AI 創新更快賦能千行百業和觸手可及。
瞭解「端側AI創新挑戰賽」的詳情情況,請參見:
https://marketing.csdn.net/p/2259814a3f79579b5f7a00ffb3f48582?pId= 3133
*The performance data was obtained through testing conducted using the OpenVINO framework on Ultra9 285H , computing happened on iGPU. The tests evaluated first-token latency, and average throughput for 960*686 resolution image input under int4-default precision settings. Each test was executed three times following a warm-up phase, with the avg value selected as the reported data.
*The performance data was obtained through testing conducted using the PyTorch framework on Ultra9 285H , computing happened on iGPU. The tests evaluated first-token latency, and average throughput for 32k input under sym-int4 precision settings. Each test was executed three times following a warm-up phase, with the avg value selected as the reported data.
向上滑動閱覽
通過使用 OpenVINO 框架版本 2025.2.0 在 英特爾® 酷睿™ Ultra 7 258V 和 英特爾® 酷睿™ Ultra 9 285H 上進行測試獲得了性能數據,計算過程發生在 iGPU 或 NPU 上。測試評估了首 Token 的延遲以及在 int4-mixed、int4-mixed-cw-sym 和 fp16 精度設定下 1K 輸入的平均吞吐量。每項測試在預熱階段後執行三次,並選擇平均值作為報告數據。性能因使用方式、配置和其他因素而異。請訪問www.Intel.com/PerformanceIndex瞭解更多信息。
性能結果基於測試時的配置狀態,可能未反映所有公開可用的更新內容。請參閱相關文檔以獲取配置詳情。沒有任何產品或組件能夠保證絕對安全。您的實際成本和結果可能會有所不同。
相關英特爾技術可能需要啓用相關硬件、軟件或激活服務。
©英特爾公司,英特爾、英特爾logo及其它英特爾標識,是英特爾公司或其分支機構的商標。文中涉及的其它名稱及品牌屬於各自所有者資產。
相關資訊
/轉載請註明出處/