智通財經APP獲悉,繼上月發佈「虛擬顯存」技術引發行業對GPU資源靈活分配的關注後,範式智能近日再次發佈GPU動態調度新進展——基於Kubernetes動態資源分配(DRA)的GPU動態調度能力,實現對GPU算力與顯存的一體化精細調度。該技術不僅是對用戶關於「算力能否像顯存一樣動態切分」疑問的深入回應,更標誌着GPU資源管理從容量擴展邁向多維資源協同調度的新階段。
隨着Kubernetes v1.34的正式發佈,其核心特性——動態資源分配(DRA)已穩定啓用,標誌着雲原生資源調度進入更智能、更靈活的時代。
在這一背景下,範式智能基於長期在AI基礎設施領域的積累,率先完成了HAMi-Core與DRA的深度適配,並推出GPU動態資源驅動(DRA Driver),讓GPU像CPU一樣被靈活共享與調度,推動雲原生算力管理體系不斷完善與升級,為人工智能算力管理帶來新的可能。
讓GPU更靈活 讓算力更高效
在AI任務中,GPU是模型訓練和推理的「引擎」,但長期以來,傳統使用方式常導致GPU資源浪費:要麼「使用不滿」,要麼「獨佔浪費」。
HAMi-Core結合DRA能力,實現了GPU的動態切分與多任務並行。簡單來說,不同的任務可以同時使用同一塊GPU,各自佔用合適的算力與顯存,就像多個應用共享CPU一樣高效。
這帶來了兩大改變:
1. 任務分發調度:同一個GPU節點上,由原來的串行分配變為並行調度,顯著提升整體效率
如果用發牌來比喻這一變化,就是從「一人發完再發下一人」到「同時發牌給所有玩家」
過去:GPU節點上的任務必須串行執行,就像發牌員一張一張發,前一個任務不結束,後一個只能等待
現在:GPU可同時為多個任務「發牌」,實現真正的並行調度,任務等待時間大幅縮短,集羣吞吐效率顯著提升
2. 任務申請資源:可以根據需求選擇不同配置的GPU,更精細、更靈活
還是用打牌來理解這個變化,就是選牌方式從「固定套餐」到「自由組合」
過去:申請GPU像點套餐,只能選固定規格,比如申請三張數值相同的「10」牌,不管任務需要多強的算力,都只能用這一檔配置
現在:用戶可以「自選組合」,根據任務需求自由搭配不同性能等級的GPU,就像同時選擇「5、9、A」等不同數字的牌——量體裁衣,既精準匹配計算需求,又避免資源浪費
這種能力的提升,讓GPU的調度更智能、利用更充分。在大規模集羣場景下,系統複雜度明顯降低,性能提升體現在調度效率和任務處理速度上,為企業帶來更流暢的算力體驗和更高的運維效率。
推動雲原生AI基礎設施的進化
HAMi-Core 作為由範式智能主導貢獻的開源項目,致力於提升GPU在容器化和雲原生環境下的利用率。此次適配工作讓HAMi-Core與Kubernetes的動態資源調度能力實現了結合,讓算力資源的申請、分配和釋放都能通過標準化方式自動完成,大幅降低了使用門檻。
這一成果不僅體現了範式智能在AI基礎設施層面的技術深耕,也展示了其對開源生態的持續投入。

開源共建 釋放更大的創新力
目前範式智能已將該演示項目開源至GitHub(Project-HAMi/k8s-dra-driver),並將與HAMi社區持續推進相關特性和生態建設,歡迎更多開發者和企業參與共建,共同推動 GPU 調度技術走向更智能、更開放的未來。

更多港股重磅資訊,下載智通財經app
更多港股及海外理財資訊,請點擊www.zhitongcaijing.com(搜索「智通財經」);欲加入智通港股投資羣,請加智通客服微信(ztcjkf)