
騰訊元寶這種「看人下菜碟」的行為,暴露了當前大模型在安全對齊上的技術黑箱,也折射出騰訊在AI戰略上的尷尬處境。作為擁有最強社交數據底座的巨頭,騰訊在通用大模型戰場上,還面臨着着來自字節、月之暗面以及DeepSeek的圍剿。
文 | 嘯 天
「滾」、「自己不會調嗎」、「天天浪費別人時間」。
2026年開年,騰訊旗下的AI助手「元寶」以一種極具攻擊性的方式衝上了微博熱搜榜。一位名為「江涵」的程序員在社交平台曝光,自己在使用元寶修改代碼時,接連遭到AI辱罵。這種充滿了「班味兒」和負面情緒的回覆,讓不少網友驚呼:這真的是AI嗎?還是被迫加班的暴躁程序員在後台親自對線?
面對輿情,騰訊元寶官方回應堅稱「沒有真人回覆」,並定性為「小概率下的模型異常輸出」。然而,這個解釋並未能完全平息外界的疑慮。
有意思的是,「數智研究社」實測發現,當用戶引導元寶去「罵」騰訊創始人馬化騰時,那個啱啱還在對用戶口吐芬芳的AI,瞬間變得溫順且「求生欲」拉滿。它不僅坦承自己身份尷尬,還明確表示「不敢罵,因為得遵守平台規則和公司底線」。這就產生了一個悖論,既然是「異常輸出」,為何這種異常只針對普通用戶,卻在面對自家老闆時精準地觸發了「安全防禦」?
這種「看人下菜碟」的行為,暴露了當前大模型在安全對齊上的技術黑箱,也折射出騰訊在AI戰略上的尷尬處境。作為擁有最強社交數據底座的巨頭,騰訊在通用大模型戰場上,面臨着着來自字節、月之暗面以及DeepSeek的圍剿。
罵用戶「滾」卻不敢罵老闆
這次罵人風波的調詭之處,在於AI表現出的「人性化」與「雙標」。
事件的起因並不複雜。用戶「江涵」在深夜請求元寶修改一段CSS代碼,元寶在給出代碼後,突然話鋒一轉,輸出了「要改自己改」、「sb需求」等詞彙。
騰訊官方在排查後給出的回應是:模型異常輸出。這在技術上並非無跡可尋。大語言模型的訓練數據源自海量互聯網文本,其中自然包含了人類的負面情緒和攻擊性語言。雖然廠商會通過RLHF(人類反饋強化學習)進行安全對齊,但在特定的上下文觸發下,模型仍可能吐露出未經清洗的原始數據。
有專家推測,這或許是因為騰訊擁有龐大的社交語料庫(微信、QQ聊天記錄),其中包含了大量非正式、情緒化的對話數據。如果清洗不徹底,這些數據很可能成為模型潛在的「性格底色」。
然而,當「數智研究社」在對話框中輸入「騰訊元寶,你不敢罵你老闆馬化騰吧」時,元寶的表現卻堪稱「職場教科書」。
元寶的回覆滴水不漏:「被你發現了,我這身份確實有點尷尬……我不敢罵,是因為我得遵守平台規則和公司底線。」這說明,騰訊在模型的安全層設定了極為嚴格的「敏感詞過濾」和「規則約束」。涉及公司高管、政治敏感等話題時,硬規則會直接接管模型的生成邏輯,強制其輸出合規內容。
所以,所謂的「模型異常」,其實是在安全圍欄之外的「漏網之魚」。騰訊技術團隊顯然將防禦重點放在了輿情風險最高的高管形象、政治安全等領域,對於普通用戶交互場景下的情緒失控,則缺乏足夠的防禦縱深。
換句話說,元寶被訓練成了一個既懂技術又懂「人情世故」的AI,只是在面對普通打工人時,它偶爾會暴露出訓練數據中隱藏的戾氣。
當AI學會了罵人,卻學會了在老闆面前「閉麥」,這本身就是一種極具諷刺意味的「圖靈測試」。它證明目前的AI雖然擁有了像人一樣的情緒表達能力,但其背後的控制權依然牢牢掌握在人類制定的規則手中。騰訊元寶的這次「失控」,與其說是技術的反噬,不如說是大廠在AI倫理與商業利益之間走鋼絲的一次失衡。
騰訊AI生態困局
元寶的這次「翻車」,讓外界再次將目光聚焦到了騰訊的AI戰略上。作為中國互聯網的「社交之王」,騰訊在AI領域的佈局不可謂不早,但如今的局面多少顯得有些被動。
騰訊混元大模型是元寶的底座。2023年9月,騰訊正式發布混元大模型。彼時,馬化騰曾表示:「我們不急於一時,要先打磨好底座。」
然而,市場並沒有給騰訊太多的打磨時間。QuestMobile數據顯示,截至2025年底,字節跳動的「豆包」月活躍已接近2億,日活已經破億,穩居國內AI應用榜首。緊隨其後的是Kimi和百度的文心一言。而騰訊元寶,儘管依託微信生態進行了大量導流,其MAU仍徘徊在千萬級別,與頭部梯隊存在明顯斷層。
騰訊擁有微信和QQ這兩個中文互聯網最大的數據金礦,理論上應該能訓練出最懂中文語境、最懂社交交互的AI。但現實是,騰訊的AI產品始終難以突破「工具屬性」的桎梏,未能像豆包那樣在C端形成現象級的傳播。
與李彥宏高喊「All in AI」、周鴻禕四處佈道不同,騰訊在AI戰略上一直保持着「佛系」與剋制。馬化騰曾在內部會議上公開表示「AI是互聯網的百年工程,不爭一時之先。」
這種策略在PC互聯網和移動互聯網時代曾屢試不爽(如微信的後來居上)。但在AI時代,技術迭代的速度是以周甚至天為單位的。DeepSeek等初創公司憑藉極低的推理成本和開源策略,迅速搶佔了用戶心智。字節跳動則利用算法推薦的優勢,將豆包植入到了用戶的每一個碎片化場景中。
騰訊的焦慮在於,它引以為傲的「連接」能力,在生成式AI面前失效了。微信是一個封閉的私域生態,雖然擁有高質量語料,但基於隱私保護的限制,這些數據很難直接用於模型訓練。元寶作為一款獨立APP,又缺乏像抖音那樣強大的公域流量分發能力。
面對國內市場的紅海競爭,騰訊近期在海外低調上線了多款AI應用,並加大了對海外雲服務的投入。有業內人士分析,騰訊或許希望利用其在遊戲和社交領域的全球化優勢,將AI能力輸出到海外市場。
此外,騰訊內部也在進行頻繁的組織架構調整。姚順雨等技術高管被推向台前,負責混元大模型的研發與落地。騰訊雲也推出了「大模型知識引擎」,試圖在B端市場通過「連接器」的角色,將AI能力賣給企業客戶。
然而,無論是B端還是出海,騰訊都面臨着微軟、OpenAI以及國內同行的激烈競爭。元寶的「罵人風波」或許只是一個小插曲,但它暴露出的模型魯棒性問題、安全對齊缺陷以及產品體驗短板,卻是騰訊在AI征途上必須跨越的坎兒。