當字節的AI洪水，試圖漫過微信們的堤壩

過去一周，中國AI領域接連發生的兩件事，形成了一組微妙的對應：字節跳動率先推出可實際體驗的「豆包AI手機」，讓人工智能大模型得以直接操控設備；緊接着，智譜宣佈開源AutoGLM，相當於把「用AI操作手機」這項能力向所有人開放。

然而，新技術的亮相，迅速演變為一場遠超預期的爭議。

風暴的中心，正是那台「豆包AI手機」——這款將大模型能力深植於操作系統底層的工程樣機「努比亞M153」，甫一問世，便遭遇微信、淘寶、美團等超級應用，以及多家高敏感度銀行應用的聯手抵制：或被拒絕登入，或被持續彈出安全警告。

爭議的焦點，也隨之從對AI功能的驚歎，迅速轉向其依賴的高系統權限（INJECT_EVENTS）所引發的隱私安全憂慮，乃至更深層的商業模式衝擊。一場關於技術邊界、數據主權與商業利益的激烈辯論，就此爆發。

相較於此前被輿論放大的商業競爭敘事，我更願意從程序員的視角，探尋這場交鋒背後的深層邏輯與潛在含義。

這讓我想起了「Python」

談到「AI手機」（或稱AI手機助手），我第一個聯想到的，就是Python。

提起Python，許多人都不會陌生。1989年聖誕節，荷蘭程序員Guido van Rossum因不滿C語言之繁瑣、Shell腳本之簡陋，在閒暇之餘創制了這門兼具功能完整與語法簡潔的新腳本語言。

此後，Python並未選擇與C++競逐性能，而是獨闢蹊徑，將「開發效率」奉為核心。在摩爾定律持續生效的年代，程序員的時間成本逐漸超越機器時間，Python恰好押中了未來：讓人更好用，比讓機器好用更有價值。

當然，C++作為經典編程語言並未因此失色。本質上，Python作為解釋型語言運行效率並不高，但其最擅長的，正是調用C/C++編寫的庫。面對高性能任務時，用C++完成底層實現，再封裝為Python接口，便能以一行Python代碼調動數千行C++邏輯。

隨着近年人工智能的興起，Python更成為深度學習框架TensorFlow與PyTorch的首選接口——想做AI，幾乎繞不開Python。

回看AI手機所做之事，與Python的思路高度相似：

Python的邏輯是：C++寫起來太麻煩，我用簡單的API在底層調用它。

AI手機的邏輯則是：App操作太繁瑣，我用自然語言在底層模擬點擊、串聯服務。

對普通用戶而言，AI手機的核心價值在於省時與提效——這與Python的定位高度契合。Python不與C++比拼性能，而是通過簡潔的接口調用底層複雜功能，最終成為連接人類邏輯與機器算力的橋樑。

但兩者的生態命運卻截然不同：Python與C++形成了經典的共生關係：C++開發者樂於讓自己的庫被Python調用，從而擴大影響力；豆包手機助手面臨的，卻是「生態抵抗」——微信、淘寶等應用不願被AI直接調用，如同要求用戶「必須親手寫C++」，手動點擊、觀看廣告。

當深度學習的需求從服務器蔓延至手機，即便是C++、Java這樣的語言，也不得不為Python的易用性讓路。

AI手機未必能成為移動領域的Python，但「Python式」的演進方向——讓人更便捷地調動底層能力——已是清晰可見的趨勢。編程語言的演進早已揭示方向：技術的終極善意，是讓人做得更少，而非更多。

我們眼前正在發生的，不僅是一款新工具的出現，也不僅是字節與騰訊們的商業博弈，而是從「打開一個個App」到「AI串聯生成所有功能」的移動互聯網範式遷移。

因此，這場爭議遠不止於技術或商業競爭，本質上是「AI代理」新範式與「App中心化」舊秩序之間的激烈碰撞。我們目睹的，正是從「打開應用」到「AI生成服務」的範式轉移前夜。

AI手機的「Python之困」

如果說Python的成功源於與底層生態（C++庫）的和諧共生，那麼豆包手機助手眼下正深陷「Python之困」——它急需調用的「庫」（各類App）並不願被輕易「導入」。

實現跨應用自動化的核心技術之一，是獲取Android系統的INJECT_EVENTS

（注入事件）權限。這一權限允許應用模擬用戶的觸摸與點擊，堪稱系統級的「上帝之手」，也隨即引發了用戶對隱私與資金安全的強烈擔憂：一個擁有如此高階權限的AI，是否可能失控？

儘管豆包官方多次聲明所有操作需經用戶明確授權，敏感環節（如支付）會暫停並交由用戶手動完成，且承諾數據不用於訓練，但疑慮並未全然消散——用戶未必總是在充分理解後果的情況下授權，也難以實時監控AI的每一步行動。

更深層的阻力，源自商業利益的根本衝突。

互聯網平台的「護城河」，正是建立在用戶必須打開App這一行為之上。AI助手繞過應用界面、直接調用服務，無異於架空應用的流量入口與交互價值。這已不是簡單的功能競爭，而是「入口控制權」與「數據主權」的爭奪。

一言以蔽之，AI手機助手觸動的，是互聯網商業模式的根基。因此，各大應用的「封堵」絕非偶然。

作為對排山倒海而來的阻力的應對，豆包已於12月5日宣佈對AI操作能力進行規範化調整，暫時下線金融、支付類應用的操作能力，並限制刷分、刷激勵及部分遊戲場景。這既是對安全關切的回應，也是在生態摩擦下的階段性妥協。

更大可能的演進邏輯

如果說字節發布的「豆包手機助手」是對App城牆發起的一次「奇襲」，那麼智譜開源AutoGLM，則無異於在關鍵時刻，向戰場投下了一把更具普惠性的「攻城錘」。

事實上，智譜此舉並非首次嘗試。AutoGLM項目已持續演進一年有餘，其早期形態依賴「雲手機」環境，功能已與豆包助手相似。

此次開源雖未引發同等規模的商業震動，但從技術演進的角度看，其意義或許更為深遠。

字節的路徑是「單點突破」，而豆包手機助手所遭遇的封禁，也印證了這種路徑在當下生態中的侷限——超級應用能夠通過點對點的防禦輕易化解。但開源，卻可能發揮出「分佈式」的力量。

一個有技術能力的學生，即可下載代碼、進行微調並部署於自己的設備中；更不必說大量開發者與公司，正等待在城牆鬆動時分得一杯羹。這不再是單次進攻，而是一場可能多點開花的「滲透戰」。

技術史上不乏相似的情節。2001年，微軟時任CEO史蒂夫·鮑爾默曾將Linux稱為「癌症」，並試圖遏制其發展。然而，抵抗的結果並非開源技術的消亡，而是微軟最終全面擁抱Linux。當一項技術擺脫單一產品的形態，成為一種開放、普適的生態基礎時，封閉體系便難以僅靠「封殺」來固守。

如今的AI手機助手，正面臨相似的關口。一旦它從某個公司的「功能」進化為開發者皆可參與建設的「通用能力」，現有應用生態將面臨根本性的挑戰。儘管「安全性」始終是合理的質疑焦點，但其作為防禦理由的邊際效應可能遞減——進入互聯網時代以來，人們早已在諸多場景中，為便利而讓渡了部分隱私。

短期內，視覺識別（CV）與多模態模型的持續進化，仍將為AI助手提供繞過API封鎖的技術路徑。長期看，更優雅的解決方案或許是走向類似MCP的標準化接口，讓App將核心功能封裝為安全的「能力組件」供AI調用。然而，讓各大平台自願開放接口，註定是一場漫長的博弈。

因此，最具可行性的「下一代Python」，或許將內生於操作系統本身。無論是iOS、Android還是HarmonyOS，由系統提供原生的AI代理服務，在權限管理與生態協調上具備天然優勢。

主流手機廠商也早已將自研AI助手定為核心戰略，系統層的AI主導權之爭，實則早已悄然展開。

終局勝利屬於誰？

Python沒有取代C++，App也不會被AI助手完全取代。

短期來看，博弈仍將繼續。騰訊、阿里等巨頭完全有能力——且正在推進——開發各自的「微信助手」、「淘寶助手」，在生態內部提升自動化體驗。然而，這類「各掃門前雪」的策略，難以孕育出那個能夠連接一切的「Python」。

技術演進的常見結局，是能力的下沉與融合：複雜功能被封裝成簡潔接口，從而催生新的產業層級與協作規則。

真正的「Python」，將是那個在技術可能性、商業利益與用戶權益之間找到最佳平衡的「連接器」。它可能源自開源社區的集體智慧，也可能誕生於操作系統廠商的頂層設計，但必然建立在行業廣泛接受的協議與標準之上。

據稱，相關行業機構已開始探討制定相關標準，強調「雙重授權」等原則，這預示着AI Agent的發展正從「野蠻生長」轉向「規範發展」。我們正站在交互範式切換的隘口，爭議、衝突與妥協，都是必經之路。

歷史不會重複，卻常押着相似的韻腳。

豆包手機助手與AutoGLM開源所引發的這場風波，或許正是這個時代更為複雜的「Python故事」跌宕起伏的開篇。最終，勝利不會歸於任何單一公司，而將屬於那個能讓技術善意、商業理性與用戶價值協同演進的新規則。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

當字節的AI洪水，試圖漫過微信們的堤壩

熱議股票