範式智能推動GPU動態調度新進展助力雲原生AI基礎設施更高效

智通財經APP獲悉，繼上月發布「虛擬顯存」技術引發行業對GPU資源靈活分配的關注後，範式智能近日再次發布GPU動態調度新進展——基於Kubernetes動態資源分配(DRA)的GPU動態調度能力，實現對GPU算力與顯存的一體化精細調度。該技術不僅是對用戶關於「算力能否像顯存一樣動態切分」疑問的深入回應，更標誌着GPU資源管理從容量擴展邁向多維資源協同調度的新階段。

隨着Kubernetes v1.34的正式發布，其核心特性——動態資源分配(DRA)已穩定啓用，標誌着雲原生資源調度進入更智能、更靈活的時代。

在這一背景下，範式智能基於長期在AI基礎設施領域的積累，率先完成了HAMi-Core與DRA的深度適配，並推出GPU動態資源驅動(DRA Driver)，讓GPU像CPU一樣被靈活共享與調度，推動雲原生算力管理體系不斷完善與升級，為人工智能算力管理帶來新的可能。

讓GPU更靈活讓算力更高效

在AI任務中，GPU是模型訓練和推理的「引擎」，但長期以來，傳統使用方式常導致GPU資源浪費：要麼「使用不滿」，要麼「獨佔浪費」。

HAMi-Core結合DRA能力，實現了GPU的動態切分與多任務並行。簡單來說，不同的任務可以同時使用同一塊GPU，各自佔用合適的算力與顯存，就像多個應用共享CPU一樣高效。

這帶來了兩大改變：

1. 任務分發調度：同一個GPU節點上，由原來的串行分配變為並行調度，顯著提升整體效率

如果用發牌來比喻這一變化，就是從「一人發完再發下一人」到「同時發牌給所有玩家」

過去：GPU節點上的任務必須串行執行，就像發牌員一張一張發，前一個任務不結束，後一個只能等待

現在：GPU可同時為多個任務「發牌」，實現真正的並行調度，任務等待時間大幅縮短，集羣吞吐效率顯著提升

2. 任務申請資源：可以根據需求選擇不同配置的GPU，更精細、更靈活

還是用打牌來理解這個變化，就是選牌方式從「固定套餐」到「自由組合」

過去：申請GPU像點套餐，只能選固定規格，比如申請三張數值相同的「10」牌，不管任務需要多強的算力，都只能用這一檔配置

現在：用戶可以「自選組合」，根據任務需求自由搭配不同性能等級的GPU，就像同時選擇「5、9、A」等不同數字的牌——量體裁衣，既精準匹配計算需求，又避免資源浪費

這種能力的提升，讓GPU的調度更智能、利用更充分。在大規模集羣場景下，系統複雜度明顯降低，性能提升體現在調度效率和任務處理速度上，為企業帶來更流暢的算力體驗和更高的運維效率。

推動雲原生AI基礎設施的進化

HAMi-Core 作為由範式智能主導貢獻的開源項目，致力於提升GPU在容器化和雲原生環境下的利用率。此次適配工作讓HAMi-Core與Kubernetes的動態資源調度能力實現了結合，讓算力資源的申請、分配和釋放都能通過標準化方式自動完成，大幅降低了使用門檻。

這一成果不僅體現了範式智能在AI基礎設施層面的技術深耕，也展示了其對開源生態的持續投入。

開源共建釋放更大的創新力

目前範式智能已將該演示項目開源至GitHub(Project-HAMi/k8s-dra-driver)，並將與HAMi社區持續推進相關特性和生態建設，歡迎更多開發者和企業參與共建，共同推動 GPU 調度技術走向更智能、更開放的未來。

更多港股重磅資訊，下載智通財經app

更多港股及海外理財資訊，請點擊www.zhitongcaijing.com（搜索「智通財經」）；欲加入智通港股投資羣，請加智通客服微信(ztcjkf)

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

範式智能推動GPU動態調度新進展助力雲原生AI基礎設施更高效

熱議股票

範式智能推動GPU動態調度新進展 助力雲原生AI基礎設施更高效

熱議股票

範式智能推動GPU動態調度新進展助力雲原生AI基礎設施更高效