文|半導體產業縱橫
隨着AI戰略全面提速,越來越多頭部企業開始瘋狂燒錢布局,硬件與算力投入持續加碼。
4月20日,據知情人士透露,字節跳動2025 年淨利潤按年下滑超過70%,淨利潤率也出現了大幅下滑,背景在於該公司在去年三、四季度大幅增加了對於AI業務的投入。與此同時,字節跳動2025年海外營收增長近50%,遠超約20%的國內增幅,海外業務營收佔比也從2024年的25%上探至三成以上,再創歷史新高。據悉,TikTok Shop 2025年GMV按年增速接近70%,是字節跳動海外營收佔比提升的主要動力。
上述知情人士表示,為支撐旗下豆包大模型、多模態AI產品的訓練與推理需求,字節跳動在2025年下半年大幅上調了AI相關投入,覆蓋高端AI芯片採購、底層模型研發等多個核心環節,鉅額開支直接導致全年淨利潤按年下滑超 70%。據了解,字節跳動對AI領域的投入還將持續加碼。公司在與股東的溝通過程中透露,2026年技術資源投入會進一步擴大,疊加海外市場合規相關的配套投入,短期淨利潤率仍將繼續承壓。與相關基礎設施建設,以滿足大模型持續迭代的算力需求
字節跳動的AI投入到底有多少呢?去年底有媒體報道稱,字節跳動2026年計劃投入230億美元,約1600億人民幣,投入到AI基礎設施建設。這個預算高於2025年的1500億。這1600億中,預計將有850億用於採購AI芯片採購。剩餘750億用於數據中心以及配套設施的建設。在1600億的預算中,預計海外算力的投入為500億。
鉅額資金押注AI的科技公司並非只有字節跳動一家公司,國內科技公司幾乎都在全力推進AI發展。從春節營銷大戰到全年戰略重心,阿里、騰訊等巨頭同樣不惜以短期利潤下滑為代價,全力爭奪AI時代的入場券。
2025年2月,阿里巴巴集團CEO吳泳銘宣佈,未來三年,阿里將投入超過3800億元,用於建設雲和AI硬件基礎設施,總額超過去十年總和。阿里巴巴把最核心的技術力量、頂級人才和電商精力向AI傾斜。4月8日阿里巴巴集團層面成立了一個技術委員會,吳泳銘親自擔任組長;能進入這個委員會的,都是阿里內最頂尖的技術人物:周靖人、吳澤明、李飛飛。周靖人被定位為首席AI架構師,李飛飛負責阿里雲的技術與AI雲基礎設施建設,吳澤明承擔集團業務技術平台以及AI推理平台的搭建。這其實是把原本分散在各業務線的技術能量集中到集團中樞,打破各自為戰的壁壘,讓決策與資源配置直接對準AI目標。其次,通義實驗室的身份發生了實質性升級,成為通義大模型事業部,由周靖人全面負責。名字看起來只變了一下,但定位已完全不同:從單純技術研發的後台,變成既要研發也要直接對接商業化,把大模型推到業務第一線,承擔起把技術轉成真金白銀的任務。
騰訊去年為AI新產品開發投入了180億元,第四季度投資新AI產品的金額就超過70億元,今年投入金額至少翻倍。騰訊首席戰略官詹姆斯·米歇爾此前表示,AI計算需求的激增並不僅僅體現在GPU上。當用戶使用智能體工具時,實際上是在創建和執行軟件,而大部分計算是在CPU上完成,同時伴隨大量內存消耗。因此,需求增長不僅體現在GPU、DRAM 或HBM上,也涵蓋CPU、普通RAM、SSD、硬盤等各類硬件,總體呈現全面上升的態勢。而百度自2023年文心一言發布以來,百度在AI領域的累計投資已超過1000億元。
缺貨:先是GPU,再是內存,現在輪到CPU
科技公司的AI鉅額資本支出直接拉動半導體產業鏈的景氣度,最開始緊缺的是GPU,隨後是內存,現在緊缺的矛頭轉向了CPU。據TrendForce預估,由於AI需求強勁,且英偉達積極推動芯片用量高的整合型GB/VR機櫃方案,2026年英偉達高端GPU出貨量將明顯增長,年增率預估近26%。
存儲更是迎來了「超級周期」元年,各類產品都進入到「漲價期」。據TrendForce最新調查,2026年第二季因DRAM原廠積極將產能轉向HBM、Server應用,並採用「補漲」策略拉近各類產品價差,儘管終端市場面臨出貨下修風險,預估整體一般型DRAM(Conventional DRAM)合約價格仍將季增58-63%。NAND Flash市場持續由AI、數據中心需求主導,全產品線連鎖漲價的效應不減,預計第二季整體合約價格將季增70-75%。
那麼存儲漲價何時休?韓國SK集團會長崔泰源公開表示,造成此輪短缺的主要原因是晶圓供應不足,而解決該問題至少需要4~5年,因此其預計,本輪內存供應短缺將持續至2030年,供應缺口超20%。
隨着Agentic AI爆發式增長,CPU正面臨嚴重短缺。據半導體行業分析機構Semianalysis Dylan Patel指出,GPU已不再是雲廠商的瓶頸,這一角色現已轉移至CPU。此前,用於AI的GPU僅執行簡單推理任務,隨着新模型推出,任務形態發生根本性變化。Agentic AI如今被大量用於數據庫調用,以及物理仿真、模擬運算等高度依賴CPU的任務。這些頻繁的數據庫訪問與CPU密集型運算,導致雲數據中心CPU使用率急劇飆升。
擴產:上游公司資本支出增加,但產能釋放還需要時間
需求如此之大,上游廠商都在積極擴產。台積電正推動全球產能擴張計劃,特別是3納米制程。在最新法說會上,台積電錶示,中國台灣仍是研發與先進製程核心基地,優先將研發留在中國台灣,以確保新制程與研發緊密整合,同時在台南科學園區新增3納米產線,預計2027年上半年量產。美國亞利桑那第二座廠已完成建設,將於2027年下半年導入3納米;日本第二座廠則規劃於2028年量產3納米。
三星電子計劃2026年投入超110萬億韓元用於資本支出和研發,目標明確而激進,即AI芯片產能提升3倍,HBM產能提升5倍。其技術路線圖清晰,正在韓國華城和平澤基地推進10納米第五代1b DRAM製程轉換及新產線擴建,同時加速HBM4量產進程,縮小與SK海力士在HBM市場的差距。
SK海力士則向江蘇無錫DRAM晶圓廠和大連NAND閃存工廠合計投資超1萬億韓元,重點推進從1Z至1A的DRAM工藝節點升級,以及321層第九代NAND產線轉換。值得注意的是,無錫工廠貢獻了其全球30%以上的DRAM產能,大連工廠則承擔了40%-45%的NAND產能。
美光預計2026財年資本支出將超過250億美元,2027財年進一步增加,核心聚焦HBM與先進DRAM產能提升,其戰略佈局清晰可見,正在加速讓所有產線具備極紫外光刻EUV設備能力,為1β節點DRAM和HBM4/5生產鋪路,同時在美國紐約州、愛達荷州及日本廣島推進晶圓廠建設,總投資達1000億美元,其新加坡新工廠也預計2028年下半年投產,強化高端NAND閃存供給。
缺口:算力需求增速約為英偉達算力供給CAGR預測值的3倍
根據OpenRouter平台的實際追蹤數據,2026年1月初至3月,全球每周Token使用量從6.4萬億次增至22.7萬億次,三個月內增幅約250%;智能體AI工具(以OpenClaw為代表)的普及速度,大幅加速了需求側的爆發;多家LLM服務商已開始對用戶設定Token使用上限,以應對需求的失控增長。大摩預測,未來算力需求增速約為NVIDIA算力供給CAGR預測值的3倍,算力短缺將長期存在且持續加劇。
在此背景下,大摩認為任何能夠打破算力擴展瓶頸的公司都將迎來重大利好。這不僅包括芯片製造供應鏈,還包括存儲器、光學網絡設備以及數據中心的核心組件。大摩極其看好這批「算力商人」(Merchants of Compute),認為他們將直接受益於這種系統性的供需失衡。
除了算力需求巨大,產能擴張需要時間也造成了供需缺口。以台積電為例,在中國台灣、美國、日本的3納米新廠建設,最早要在2027年下半年投產。
在這樣的行業背景下,全球科技巨頭正陷入一場轟轟烈烈的 AI 軍備競賽,硬件漲價、算力緊缺、利潤承壓成為常態,也讓我們更需要回到 AI 的本源。回望 AI 發展歷程,2016 年德米斯・哈薩比斯及其創辦的 DeepMind 憑藉 AlphaGo 擊敗李世石,次年又戰勝棋手柯潔,正式宣告人工智能時代到來;2022 年,OpenAI 發布 ChatGPT,AI 發展拐點如期而至。《哈薩比斯:谷歌 AI 之腦》一書中,不僅記錄了這位全球頂尖 AI 科學家的思想歷程,更揭示了 DeepMind 如何以科學深耕與穩健佈局,超越追求速度與流量的模式,重回全球 AI 領導者位置。對於正處在投入與擴張關鍵期的全球 AI 產業而言,這種長期主義的研發理念與科學導向的發展路徑,無疑具有重要的參照意義。