當字節的AI洪水,試圖漫過微信們的堤壩

錦緞
2025/12/12

過去一週,中國AI領域接連發生的兩件事,形成了一組微妙的對應:字節跳動率先推出可實際體驗的「豆包AI手機」,讓人工智能大模型得以直接操控設備;緊接着,智譜宣佈開源AutoGLM,相當於把「用AI操作手機」這項能力向所有人開放。

然而,新技術的亮相,迅速演變為一場遠超預期的爭議。

風暴的中心,正是那臺「豆包AI手機」——這款將大模型能力深植於操作系統底層的工程樣機「努比亞M153」,甫一問世,便遭遇微信、淘寶、美團等超級應用,以及多家高敏感度銀行應用的聯手抵制:或被拒絕登入,或被持續彈出安全警告。

爭議的焦點,也隨之從對AI功能的驚歎,迅速轉向其依賴的高系統權限(INJECT_EVENTS)所引發的隱私安全憂慮,乃至更深層的商業模式衝擊。一場關於技術邊界、數據主權與商業利益的激烈辯論,就此爆發。

相較於此前被輿論放大的商業競爭敘事,我更願意從程序員的視角,探尋這場交鋒背後的深層邏輯與潛在含義。

01

這讓我想起了「Python」

談到「AI手機」(或稱AI手機助手),我第一個聯想到的,就是Python

提起Python,許多人都不會陌生。1989年聖誕節,荷蘭程序員Guido van Rossum因不滿C語言之繁瑣、Shell腳本之簡陋,在閒暇之餘創制了這門兼具功能完整與語法簡潔的新腳本語言。

此後,Python並未選擇與C++競逐性能,而是獨闢蹊徑,將「開發效率」奉為核心。在摩爾定律持續生效的年代,程序員的時間成本逐漸超越機器時間,Python恰好押中了未來:讓人更好用,比讓機器好用更有價值。

當然,C++作為經典編程語言並未因此失色。本質上,Python作為解釋型語言運行效率並不高,但其最擅長的,正是調用C/C++編寫的庫。面對高性能任務時,用C++完成底層實現,再封裝為Python接口,便能以一行Python代碼調動數千行C++邏輯。

隨着近年人工智能的興起,Python更成為深度學習框架TensorFlow與PyTorch的首選接口——想做AI,幾乎繞不開Python。

回看AI手機所做之事,與Python的思路高度相似:

Python的邏輯是:C++寫起來太麻煩,我用簡單的API在底層調用它。

AI手機的邏輯則是:App操作太繁瑣,我用自然語言在底層模擬點擊、串聯服務。

對普通用戶而言,AI手機的核心價值在於省時與提效——這與Python的定位高度契合。Python不與C++比拼性能,而是通過簡潔的接口調用底層複雜功能,最終成為連接人類邏輯與機器算力的橋樑。

但兩者的生態命運卻截然不同:Python與C++形成了經典的共生關係:C++開發者樂於讓自己的庫被Python調用,從而擴大影響力;豆包手機助手面臨的,卻是「生態抵抗」——微信、淘寶等應用不願被AI直接調用,如同要求用戶「必須親手寫C++」,手動點擊、觀看廣告。

當深度學習的需求從服務器蔓延至手機,即便是C++、Java這樣的語言,也不得不為Python的易用性讓路。

AI手機未必能成為移動領域的Python,但「Python式」的演進方向——讓人更便捷地調動底層能力——已是清晰可見的趨勢。編程語言的演進早已揭示方向:技術的終極善意,是讓人做得更少,而非更多。

我們眼前正在發生的,不僅是一款新工具的出現,也不僅是字節與騰訊們的商業博弈,而是從「打開一個個App」到「AI串聯生成所有功能」的移動互聯網範式遷移。

因此,這場爭議遠不止於技術或商業競爭,本質上是「AI代理」新範式與「App中心化」舊秩序之間的激烈碰撞。我們目睹的,正是從「打開應用」到「AI生成服務」的範式轉移前夜。

02

AI手機的「Python之困」

如果說Python的成功源於與底層生態(C++庫)的和諧共生,那麼豆包手機助手眼下正深陷「Python之困」——它急需調用的「庫」(各類App)並不願被輕易「導入」。

實現跨應用自動化的核心技術之一,是獲取Android系統的INJECT_EVENTS

(注入事件)權限。這一權限允許應用模擬用戶的觸摸與點擊,堪稱系統級的「上帝之手」,也隨即引發了用戶對隱私與資金安全的強烈擔憂:一個擁有如此高階權限的AI,是否可能失控?

儘管豆包官方多次聲明所有操作需經用戶明確授權,敏感環節(如支付)會暫停並交由用戶手動完成,且承諾數據不用於訓練,但疑慮並未全然消散——用戶未必總是在充分理解後果的情況下授權,也難以實時監控AI的每一步行動。

更深層的阻力,源自商業利益的根本衝突。

互聯網平臺的「護城河」,正是建立在用戶必須打開App這一行為之上。AI助手繞過應用界面、直接調用服務,無異於架空應用的流量入口與交互價值。這已不是簡單的功能競爭,而是「入口控制權」與「數據主權」的爭奪。

一言以蔽之,AI手機助手觸動的,是互聯網商業模式的根基。因此,各大應用的「封堵」絕非偶然。

作為對排山倒海而來的阻力的應對,豆包已於12月5日宣佈對AI操作能力進行規範化調整,暫時下線金融、支付類應用的操作能力,並限制刷分、刷激勵及部分遊戲場景。這既是對安全關切的回應,也是在生態摩擦下的階段性妥協。

02

更大可能的演進邏輯

如果說字節發佈的「豆包手機助手」是對App城牆發起的一次「奇襲」,那麼智譜開源AutoGLM,則無異於在關鍵時刻,向戰場投下了一把更具普惠性的「攻城錘」。

事實上,智譜此舉並非首次嘗試。AutoGLM項目已持續演進一年有餘,其早期形態依賴「雲手機」環境,功能已與豆包助手相似。

此次開源雖未引發同等規模的商業震動,但從技術演進的角度看,其意義或許更為深遠。

字節的路徑是「單點突破」,而豆包手機助手所遭遇的封禁,也印證了這種路徑在當下生態中的侷限——超級應用能夠通過點對點的防禦輕易化解。但開源,卻可能發揮出「分佈式」的力量。

一個有技術能力的學生,即可下載代碼、進行微調並部署於自己的設備中;更不必說大量開發者與公司,正等待在城牆鬆動時分得一杯羹。這不再是單次進攻,而是一場可能多點開花的「滲透戰」。

技術史上不乏相似的情節。2001年,微軟時任CEO史蒂夫·鮑爾默曾將Linux稱為「癌症」,並試圖遏制其發展。然而,抵抗的結果並非開源技術的消亡,而是微軟最終全面擁抱Linux。當一項技術擺脫單一產品的形態,成為一種開放、普適的生態基礎時,封閉體系便難以僅靠「封殺」來固守。

如今的AI手機助手,正面臨相似的關口。一旦它從某個公司的「功能」進化為開發者皆可參與建設的「通用能力」,現有應用生態將面臨根本性的挑戰。儘管「安全性」始終是合理的質疑焦點,但其作為防禦理由的邊際效應可能遞減——進入互聯網時代以來,人們早已在諸多場景中,為便利而讓渡了部分隱私。

短期內,視覺識別(CV)與多模態模型的持續進化,仍將為AI助手提供繞過API封鎖的技術路徑。長期看,更優雅的解決方案或許是走向類似MCP的標準化接口,讓App將核心功能封裝為安全的「能力組件」供AI調用。然而,讓各大平臺自願開放接口,註定是一場漫長的博弈。

因此,最具可行性的「下一代Python」,或許將內生於操作系統本身。無論是iOS、Android還是HarmonyOS,由系統提供原生的AI代理服務,在權限管理與生態協調上具備天然優勢。

主流手機廠商也早已將自研AI助手定為核心戰略,系統層的AI主導權之爭,實則早已悄然展開。

03

終局勝利屬於誰?

Python沒有取代C++,App也不會被AI助手完全取代。

短期來看,博弈仍將繼續。騰訊、阿里等巨頭完全有能力——且正在推進——開發各自的「微信助手」、「淘寶助手」,在生態內部提升自動化體驗。然而,這類「各掃門前雪」的策略,難以孕育出那個能夠連接一切的「Python」。

技術演進的常見結局,是能力的下沉融合:複雜功能被封裝成簡潔接口,從而催生新的產業層級與協作規則。

真正的「Python」,將是那個在技術可能性、商業利益與用戶權益之間找到最佳平衡的「連接器」。它可能源自開源社區的集體智慧,也可能誕生於操作系統廠商的頂層設計,但必然建立在行業廣泛接受的協議與標準之上。

據稱,相關行業機構已開始探討制定相關標準,強調「雙重授權」等原則,這預示着AI Agent的發展正從「野蠻生長」轉向「規範發展」。我們正站在交互範式切換的隘口,爭議、衝突與妥協,都是必經之路。

歷史不會重複,卻常押着相似的韻腳。

豆包手機助手與AutoGLM開源所引發的這場風波,或許正是這個時代更為複雜的「Python故事」跌宕起伏的開篇。最終,勝利不會歸於任何單一公司,而將屬於那個能讓技術善意、商業理性與用戶價值協同演進的新規則。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10