文|數智前線 任曉漁 遊勇
智算熱潮裏的冷思考
2024年,雖然融資市場呈現冰火兩重天,但全球人工智能和大模型市場始終保持着超強的吸金能力,產業鏈各個環節融資動態頻出。
生成式AI繼續發酵,2024年的智算市場稱得上炙手可熱。
中國通信工業協會數據中心委員會在剛剛過去的12月發佈了《中國智算中心產業發展白皮書》,其中的數據顯示,2024年11月,全國已投運的智算中心項目近150個,在建及規劃建設的智算中心項目近400個。
數智前線此前也統計,僅2024年前7個月,包含土建基礎設施和IT基礎架構等方方面面在內,智算中心相關項目中標公告已發佈超140個。
行業的火爆,甚至還能從從業者在各大論壇及產業交流羣裏的熱火朝天交流身影中可見一斑。年初開始,許多計算及大模型相關產業羣裏,最活躍的人裏肯定有智算從業者。
業界觀察到,這股建設熱潮呈現出了幾大特徵:
首先,市場需求的爆發速度,遠超業界人士的想象。
IDC中國企業級研究部研究經理楊洋就表示,他們在2023年下半年預測時已經對智算服務市場增長充分樂觀,但從2024年的實際情況看,他們此前的預估依然偏保守,整個智算服務市場在以遠超預期的增速在成長。
預期以外的高增速,既使得智算中心的項目建設數量在大幅增加,智算中心的建設規模也在不斷膨脹。
根據數智前線此前對各類公開招投標數據的不完全統計,僅從去年前幾個月數據看,智算中心的招投標項目數量逐月遞增。而招投標數據還顯示,許多項目的中標金額超過了1億元,去年6月最大的項目,平潭兩岸融合智算中心項目(一期),中標金額達到了4.06億元。
其次,建設和需求主體越來越多樣。不同於國外的智算基礎設施以公有云部署爲主的模式,在國內,雲計算廠商構建的AI雲,地方政府、運營商以及一些金融行業企業共同推動了當下的智算基礎設施建設熱潮。
地方政府投入多爲推動產業發展考量,IDC數據顯示,截至去年6月,過去幾年裏政府參與建設並已投產上線的智算中心數量已接近百個。
而運營商的角色也凸顯出來。數智前線此前統計,去年前7個月的智算相關招投標項目,運營商主導的比例超四成。
從需求方看,對智算需求的行業也非常多元。大模型創業企業的需求自不必提,車企、手機廠商和高校的智算需求也在步步走高。
車企在智算市場,不算新玩家。幾年前開始它們的採購規模就僅次於互聯網企業。生成式AI到來後,大模型上車成爲行業熱點。一位車企行業人士判斷,未來1~2年車企智算需求將會翻兩番。
高校的智算需求也因爲AI For Science熱潮一路走高。許多高校在智算領域的投入力度不小,一些項目的建設規模甚至在數億元水平。醫療行業裏,更高效的算力基礎設施可以加速醫療影像數據處理與分析的速度,提升診斷水平和服務質量,一些大型醫療機構和研究院校也有了不小的智算需求。
不過,這股建設熱潮裏,業界也不乏資深人士發出一些偏理性的聲音。
比如有人提到,算力焦慮在當前智算中心建設熱潮下,好像依然沒有解決。
中國計算機學會(CCF)副理事長陳健去年9月也在中國高性能計算學術年會上指出,一味增加硬件資源而不考慮效能,是對資源和財力的浪費。他表示,行業內需要考量如何更有效地開發和利用現有資源。
還有聲音認爲,上一波算力基礎設施建設熱潮中就曾出現過利用率低問題,當下的智算中心建設,不能只追求規模,重硬件輕軟件、重建設輕運營的建設思路並不可取。
國家信息中心信息化和產業發展部主任單志廣也曾提醒,要避免重建設、輕需求,應以應用爲導向,提高整個算力中心的利用度。
複雜多元需求,呼喚“精裝算力”
冷思考背後,本質是與當下大模型應用和落地呈現出了場景和業務多元、任務差異較大的特點密切相關。
比如大模型落地最積極的金融行業,需要的是低延時和高性能算力,來處理海量的金融交易數據,以及支持實時的業務決策;新能源汽車客戶,由於智駕的旺盛需求,對邊緣算力會有更高的需求;而對於很多ToC應用爲主的客戶,它們對模型推理的需求會顯著高於訓練的需求。
諸如此類,業務場景的不同、訓推場景的差異,對算力的需求千差萬別。以前只重視算力集羣的規模,一昧迷信堆卡的做法越來越行不通。大模型賽道需要從全局智算角度,統籌算力的供給。
不久前的烏鎮互聯網大會上,寧暢針對上述用戶痛點,提出了非常形象的“精裝算力”概念,引發了行業內的廣泛關注。
好比精裝修的房子一樣,依託寧暢的定製化與全棧全液能力,以算力棧爲交付形態,從用戶需求與體驗出發,提供全體系軟硬協同的精細化算力服務,最終給用戶提供拎包入住的算力服務體驗。
精裝算力得以實現有兩大前提:一是定製化,二是全棧全液。
定製化在“硬裝”層面可體現爲給用戶提供了多種交付形態的靈活組合。比如可以提供覆蓋雲、邊、端等多種業務場景的服務器,不僅支持高密、通用、AI等多種服務器形態,也支持全閃、混閃等多種存儲組合。比如寧暢AI工作站-塔式服務器W350 G50可部署在辦公環境或搬運至外景地,被廣泛應用於影視渲染、汽車智造、工業仿真等領域。
而且,寧暢還可以根據散熱模塊提供液冷、風冷、風液混合等部署方案,確保根據不同場景和需求調整最優的散熱方式,不僅極大提升了算力效率,也儘可能的降低了成本。
但算力的發揮光靠硬件支撐是不夠的,還需要軟件層的優化,也就是精裝算力的“軟裝修”。寧暢的算力軟裝修可以從基礎算子優化、系統功能優化、運營支撐優化、模型性能優化到平臺級AI管理的全局優化,涵蓋“算存網管用”算力運行的完整體系。
比如在平臺級AI管理方面,寧暢全面支持NVIDIA AI Enterprise(NVAIE)平臺,加速數據科學工作流並簡化生成式AI的開發和部署,再搭配寧暢自有的AI Manager管理平臺,提供集計算、運營、運維於一體的平臺級AI管理服務。
另外,寧暢也是業內少數能提供“全棧全液”AI基礎設施方案的廠商,涵蓋了從底層硬件到頂層應用平臺的全棧系統環境支持,並提供全液冷產品方案,在寧暢全棧液冷模塊化解決方案支持下,智算中心的PUE值最低可達到1.08,針對超大型算力中心,寧暢的浸沒式液冷全棧解決方案最低可將PUE降至1.05,助力實現高效與綠色並行。
這意味着,在這套軟硬件全棧+定製化的精裝算力加持下,寧暢可以根據不同行業的特點,比如互聯網、汽車、製造等提供有針對性的解決方案,讓不同行業的客戶在AI時代能獲得交付省心、運維省錢、部署省力、推訓省時的優質體驗。
如今,在大模型加速落地的大背景下,企業對算力的效率和成本有着更加嚴苛的要求,寧暢的算力精裝房,極大限度地給企業帶來了“拎包入住”的便利。
而這套全體系軟硬協同的算力服務也正在被越來越多企業所採納。寧暢在浙江桐鄉搭建的首個精裝算力樣板間——寧暢算力棧已吸引了超千家客戶申請試用,越來越多的大模型在寧暢的支持下順利落地。
全棧式服務,助力AI更快落地
中國信通院在《智算基礎設施發展研究報告(2024)》中提到,全棧式服務,正在成爲智算基礎設施能否爲用戶提供優質AI服務的重要標誌之一。智算基礎設施應構築全棧技術能力,方便用戶使用智能算力。
服務提供商構建全棧生態,能讓用戶獲得涵蓋硬件、軟件、算法、數據等各個方面的服務支持。這有助於智算的使用者,廣大的開發羣體和企業用戶提高開發效率,減少開發成本。對智算服務提供方而言,全棧式服務的好處則在於能擴展潛在用戶範圍,增加服務客戶的深度,增加客戶粘性。
全棧式的能力包含從算力規劃設計、中心建設和平臺運營多個環節。目前寧暢能提供從集羣搭建、業務接入、訓推任務、集羣運維、算力運營等貫穿算力中心全生命週期的設、建、運一體化服務。它也是“全局智算”戰略和產品理念的反映。
全棧式的服務之下,寧暢精裝算力能覆蓋軟硬件全體系及全液冷產品,可提供諮詢、測試、運維、售後的全流程服務,滿足各行業用戶大模型開發、適配、部署的全場景需求,並能按用戶發展階段,定製專業且性價比高的AI計算方案,爲企業的AI應用和落地提供了更好的支撐。
目前,精裝算力理念,已經在互聯網、醫療、科研、汽車等多個行業取得了顯著成效,助力這些領域提升算力利用率,降低使用成本。
比如一些互聯網企業也研發了自己的模型。他們希望能夠加速模型研發進度,從而在激烈的市場競爭中保持優勢。寧暢算力棧通過高效算力管理和GPU加速技術,就幫助某互聯網企業縮短了模型訓練週期、加速產品迭代,並提升了20%的算力利用率,有效加速了其業務的創新發展。
AI for Science方興未艾,行業十分關注如何基於高效的基礎設施來加速創新流程。某大學在寧暢算力棧助力下,不僅在物理模擬和氣象預報中顯著提高了運算速度,還在藥物分子模擬研究中大幅縮短了計算時間。在該案例中,寧暢算力棧支持複雜的深度學習模型訓練,加快了自然語言處理、圖像識別等領域的研究進度,將計算時間最高節省了82%,科研工作效率提升20%,直接推動了科研成果的快速轉化。
同樣的情況還發生在醫療、汽車等多個行業。精裝算力理念下,寧暢的算力棧,經受住了多家關鍵領域頭部企業的需求考驗,切實支持了這些企業的創新。
智算行業的比拼正進入新的階段。接下來的智算中心建設,規模只是其中一個考量,更重要的是要比計算效率,比算力調度管理,也要比軟件優化。精裝算力的時代正在到來。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。