
今年1月,蘋果宣佈將在其產品中使用谷歌Gemini大模型,這相當於承認這家iPhone製造商過去幾年在人工智能領域無法憑一己之力參與競爭。但該協議也表明,蘋果正再次依靠外部公司彌補另一項短板:雲計算能力。
如今,蘋果有可能進一步加深對谷歌雲的依賴。據兩位了解談判情況的人士透露,應蘋果要求,谷歌已研究在其數據中心內部部署服務器,用於運行即將推出的Siri版本。這款由Gemini驅動的數字助手,同時將符合蘋果的隱私標準。蘋果目前已在在線存儲、內部AI模型訓練等服務上依賴谷歌雲。
過去,蘋果曾表示,會將用戶發出的複雜AI查詢請求,發送至名為私有云計算(Private Cloud Compute) 的蘋果系統,該系統運行在搭載蘋果自研芯片的服務器上(簡單AI查詢則在設備本地處理)。
多年來,蘋果一直渴望在雲計算領域實現自給自足。公司多位高管曾試圖搭建內部基礎設施,以減少對谷歌、亞馬遜雲科技等雲服務商的依賴。
但據十幾位蘋果前高管和工程師稱,這些雲相關努力過去屢屢受阻,原因是蘋果財務高管將雲計算視為令人厭煩的成本中心,而非戰略重點。這些人士表示,蘋果不願對自有基礎設施大舉投入,導致雲領域專家不斷離職。
近年來,外界越來越質疑蘋果相較同行在數據中心投入不足,蘋果則向投資者表示,其「混合式」基礎設施策略——結合公有云服務與蘋果自有基礎設施——運行狀況良好。
蘋果在雲計算上的困境,與其在AI領域的受挫並行發生,且在很多方面相互關聯。過去一年,蘋果難以按時推出由AI驅動的Siri全面改版,已上線的AI功能也反響平平。
前員工透露,蘋果私有云計算的平均利用率僅為10%,使用率低到部分為蘋果AI雲準備的服務器仍存放在倉庫中、尚未安裝。不過,如果蘋果宣稱今年推出的新版Siri受到用戶歡迎,其AI算力需求可能會迅速激增,這也能解釋蘋果為何與谷歌商談託管助手事宜。
蘋果在雲計算上依賴谷歌,與該公司一貫堅持掌控產品核心組件的理念形成鮮明反差。蘋果以自主設計硬件、軟件、芯片等關鍵部分著稱,以此讓設備相比競品具備優勢。
與此同時,蘋果也以精打細算聞名,尤其在修建數據中心這類需要鉅額前期資本支出的項目上。近年來,Meta、微軟、谷歌、亞馬遜等公司為適配AI需求爆發,史無前例地大舉投入建設數據中心,而蘋果基本置身事外。
相反,蘋果財務高層更傾向於從外部雲服務商租用AI算力及其他服務。誠然,正如OpenAI和Anthropic所證明的,擁有自有數據中心並非成為AI領導者的前提。但一旦雲服務商選擇提價,過度依賴外部公司可能會令其後悔,屆時AI公司或許被迫自建更多服務器。
前蘋果雲工程師表示,或許更嚴重的問題在於,蘋果文化仍圍繞設備銷售展開,而設備銷售佔其營收絕大部分。即便蘋果從音樂、App Store及其他服務中賺取更多收入(這些服務要麼運行在自有云基礎設施,要麼租用其他廠商服務器),這一點依然沒有改變。
蘋果混亂的後端內部基礎設施進一步加劇了困境。公司內部多個部門使用各自的服務器或各類雲服務,與谷歌等其他大型科技公司統一算力資源池供工程師調用的模式形成對比。
曾參與下一代Siri研發、並於去年12月離職的伊戈爾·納夫紐克此前在谷歌基礎設施部門工作十餘年,他表示:「蘋果和谷歌的工程文化截然不同。谷歌大部分系統是集中式的,所有人使用同一台超級計算機;而在蘋果,技術選擇是相互割裂、各自為戰的。」
嚴控成本
蘋果的雲困境可追溯至數十年前。
2003年iTunes音樂商店上線後,蘋果開始擴大小型數據中心規模,以支撐數字音樂銷售這一蓬勃發展的新業務。
隨着蘋果在線服務不斷擴張,其使用了五花八門的系統分別運營。例如,2008年推出的個性化歌單功能iTunes Genius,搭建在與iTunes相獨立的技術和服務器上,原因是蘋果希望對用戶音樂庫分析數據進行匿名化處理。
大約在同一時期,蘋果開始越來越依賴公有云服務——這一當時新穎的概念由亞馬遜雲科技開創,即向外部企業客戶出租大型數據中心。AWS是蘋果2011年推出的iCloud存儲服務的早期在線存儲提供商。
但當蘋果計劃推出iCloud照片備份功能時,隨着大量iPhone用戶拍照,公有云存儲的高昂成本讓公司不堪重負。為節省開支,蘋果開始自建服務器用於iCloud照片備份。此舉還帶來另一好處:據參與該項目的一位蘋果前高管稱,當蘋果告知AWS其計劃後,亞馬遜將向蘋果收取的雲服務費用減半。蘋果此後繼續同時使用自有服務器與雲服務商服務器。
到2013年,蘋果財務部門對公有云及自有服務器帶來的成本飆升感到不滿,開始詢問服務團隊是否充分利用了公司已有的內部基礎設施。
前蘋果工程師表示,這些團隊顯然在服務器部署上缺乏協同,導致基礎設施重複建設、資源閒置。例如,iTunes服務器有閒置雲容量時,其他蘋果團隊無法使用。
2013年,蘋果指派時任工程總監帕特里克·蓋茨,負責將分散的服務器基礎設施整合為所有團隊均可使用的公共資源池。他牽頭成立了新部門「平台基礎設施工程」,參照亞馬遜和谷歌的現代雲系統模式搭建共享資源。
ACDC項目
但據前蘋果工程師稱,蓋茨難以推動公司各部門使用這一集中化平台,最終於2018年離職。2019年,曾任推特工程副總裁、微軟雲早期工程負責人的邁克·艾博特接手該部門,繼續推進項目。
艾博特試圖在蘋果內部塑造更偏向雲服務的文化。2021年,他在公司內部發起「基礎設施峯會」線上活動,旨在推動全公司在共享基礎設施上協作。
他還推動了多項新舉措,其中最著名的是ACDC項目,即將蘋果芯片技術應用於自有數據中心服務器。該項目全稱「Apple chips in data center」(數據中心使用蘋果芯片),初衷是讓運行蘋果在線服務的數據中心,達到與蘋果設備同等嚴格的隱私標準。
據此前報道,他還提議蘋果考慮最終向外部開發者出租服務器,類似亞馬遜和谷歌的公有云服務。該項目前負責人稱,蘋果芯片主管約翰尼·斯魯吉是這一項目的強力支持者,認為這是向企業客戶提供其團隊研發芯片的機會。
但該團隊前員工表示,由於財務部門反對,艾博特的多個項目推進困難。財務團隊認為,現有服務器利用率不足,不願再為蘋果自有云服務追加投資,並相信依賴外部雲服務商能更好地控制基礎設施成本。
2023年,艾博特離開蘋果加入通用汽車。他的離職很快引發蘋果雲領域人才流失,許多他招募的員工隨即追隨其加入這家車企。
轉向谷歌雲
2022年底ChatGPT 3.5的問世,對整個科技行業是顛覆性時刻,也徹底改變了蘋果對AI和雲的思路。
在ChatGPT推出前,蘋果對Siri的核心目標是儘可能高效運行,優先在設備本地而非雲端處理用戶交互,蘋果認為這能更好保護用戶數據隱私。ChatGPT展現出基於雲端大模型的巨大潛力後,蘋果意識到無法固守舊模式,需要更多借助雲端算力。
但問題隨之而來:蘋果內部AI基礎設施開始老化。相關人士稱,2023年,公司開始停用數據中心大量逐漸故障的老舊英偉達芯片,這項工作多年前就計劃開展,卻一直被擱置。蘋果需要用更適配最新AI技術的新型號替換這些老舊芯片。
在財務部門推動下,蘋果選擇主要依靠外部雲服務商推進AI計劃,如同其在存儲等其他服務上的做法。長期雲服務商AWS成為蘋果AI佈局的首個重要合作伙伴,蘋果也是亞馬遜自研英偉達AI芯片替代品Inferentia和Trainium2的早期客戶。
與谷歌合作則更為曲折。多年來,出於隱私顧慮,蘋果禁止AI工程師使用谷歌雲。Siri處理蘋果設備用戶的個人身份信息,蘋果不願承擔數據泄露給外部公司的任何風險。實際上擔任蘋果隱私主管的軟件主管克雷格·費德里吉,多次否決使用谷歌雲滿足AI算力需求的方案。
但2023年,谷歌對安全系統進行升級,滿足了蘋果的隱私要求。蘋果迅速開始採用谷歌雲滿足AI需求,包括使用谷歌定製芯片張量處理單元——蘋果測算後發現,其運行成本遠低於英偉達同類芯片。
私有云
蘋果需要向外界證明自己正嚴肅對待AI。ChatGPT的爆發式增長,迫使谷歌、亞馬遜及幾乎所有大型科技公司紛紛推出更智能、更具對話能力的AI產品。在2024年蘋果全球開發者大會上,蘋果終於行動,宣佈推出Apple Intelligence——一套基於ChatGPT所普及的生成式模型的AI工具集。
蘋果指派此前由艾博特牽頭的ACDC項目團隊,協助Apple Intelligence上線。儘管該項目最初並非聚焦AI,團隊仍緊急搭建了代號「頂針項目」的私有云計算系統,為蘋果下一代AI產品提供更私密的算力支持。參與該項目的前員工稱,儘管蘋果在2024年6月與Apple Intelligence一同宣佈了私有云計算,但該系統當時尚未實際運行,進度滯後六個月(最終於2024年底上線)。
隨後數月,蘋果陸續推出Apple Intelligence部分功能,如AI寫作工具、通知摘要等,但公衆和科技評論者普遍感到失望。對蘋果而言,更嚴重的問題是,經過全面改版、更具對話能力的Siri版本遲遲無法推出。
蘋果與谷歌就Siri託管展開的商談,可能表明蘋果希望為今年晚些時候新版Siri推出後、設備端AI活動激增的情況做好準備。
商談背後的另一個原因可能是,私有云計算在蘋果自有數據中心內運行效果不佳。前員工稱,其AI服務器的軟件更新耗時遠長於其他類型服務器。此外,蘋果雲工程師和AI部門前員工表示,私有云計算服務器上的蘋果芯片並非為AI設計,難以很好地運行谷歌Gemini這類大模型。
責任編輯:劉明亮