Krystal Hu
路透10月22日 - (人工智能》每周三出版。您認為您的朋友或同事應該了解我們嗎?請將此新聞通訊轉發給他們。他們也可以在這裏訂閱 (link).)
史蒂夫-班農(Steve Bannon)、傑弗裏-辛頓(Geoffrey Hinton)和哈里王子與梅根-馬克爾(Meghan Markle)有什麼共同點?
不是政治、媒體或君主制。而是人工智能。他們都想阻止超級智能人工智能的發展--理論上,這種人工智能可以完全超越人類。
本周三,"未來生命研究所"(Future of Life Institute)發表了一封 公開信, (link) ,呼籲在科學證明超級智能人工智能系統是安全的,而且公衆確實需要它們之前,禁止創造超級智能人工智能系統。該聯盟的成員既有右翼媒體人士,也有人工智能先驅。
你可能還記得,同一個組織曾呼籲 在 2023 年暫停人工智能開發 (link) ,當時甚至得到了埃隆-馬斯克(Elon Musk)的支持。這一次,他沒有參與--也許是因為他正忙於通過他的企業xAI來賭一個相反的結果,最近,他聲稱其Grok 5達到人工通用智能$(AGI)$ 的幾率 "現在是10%,而且還在上升"。
但 AGI 到底是什麼?人工智能又是什麼--每個人都在擔心的 "超級智能"?當然,人工智能模型現在可以 在奧林匹克級別的數學競賽中獲勝, (link) ,這在一年前是不可想象的,但這是否意味着它們具有一般智能呢?
有人說還不能。一羣人工智能研究人員對科技公司不斷轉移目標感到沮喪,他們提出了一個清晰、可衡量的 AGI 定義,以及一個基準系統。我與他們討論了為什麼了解人工智能能做什麼、不能做什麼很重要,以及我們離他們定義的 AGI 到底還有多遠。
與此同時,OpenAI 的新瀏覽器正試圖向我們展示,人工智能已經改變了我們獲取信息或購買雜貨的方式。在我看來,這款旨在挑戰谷歌的產品也說明了谷歌對互聯網的持久影響力。請繼續閱讀。
電子郵件 我 (link) 或在 LinkedIn (link) 分享任何想法。
我們在科技與人工智能領域的最新報導:
芯片緊縮:人工智能熱潮如何刺激不那麼時髦的內存價格? (link)
投資數十億美元后,人們對人工智能泡沫看法不一 (link)
獨家-知情人士:芯片製造商CXMT計劃在上海上市,估值420億美元 (link)
Meta與藍貓資本就路易斯安那州數據中心達成270億美元孖展協議 (link)
新研究顯示:人工智能助手在新聞方面普遍出錯 (link)
開放與谷歌的角力
在本周二的OpenAI展示會上,谷歌(Google GOOGL.O)的身影比比皆是--儘管該活動旨在挑戰谷歌的主導地位。OpenAI發布了期待已久的人工智能瀏覽器Atlas,這是它與Chrome競爭的最直接嘗試。但從 YouTube 直播到谷歌文檔和 Gmail 的演示,谷歌的影子無處不在。當由 ChatGPT 支持的瀏覽器試圖搜索信息和視頻時,它悄無聲息地導航到了谷歌標籤頁。
投資者並沒有忽視這種諷刺意味。ChatGPT 現象已經改變了 8 億人獲取信息的方式,迫使谷歌重新思考其核心業務--搜索。Chrome 瀏覽器本應像 ChatGPT 對谷歌搜索所做的那樣:顛覆一種根深蒂固的習慣,這樣 OpenAI 就能把用戶的時間和注意力從谷歌的生態系統中拉出來,而在谷歌的生態系統中,每一次點擊和查詢都會帶來潛在的廣告收入。
OpenAI的新瀏覽器充其量只能算是反應平平。部分原因是它看起來很像 Chrome 瀏覽器--因為它本質上就是 Chrome 瀏覽器。正如我們 首次報導的那樣 , (link) ,該瀏覽器基於谷歌的開源基礎 Chromium 構建 。
這次亮相也提醒人們注意谷歌最深層次的優勢:搜索。OpenAI 仍然在很大程度上依賴谷歌的索引來顯示實時結果,減少幻覺。最近,當谷歌將其搜索規則限制在前 10 個結果時,ChatGPT 的答案發生了明顯的變化--例如,失去了許多 Reddit 引用。
這種依賴並非沒有嘗試過。OpenAI於2024年初開始構建自己的搜索產品,但公司高管後來承認,他們最初的目標--到2025年底讓ChatGPT 80%的回答都依賴OpenAI自己的搜索索引--過於雄心勃勃,可能還需要幾年時間。今年夏天,OpenAI 尋求與谷歌直接合作,但根據高管的證詞,他們遭到了拒絕。
雖然反壟斷法官最近裁定谷歌不必出售 Chrome 瀏覽器,但谷歌如何利用其在搜索領域的超級實力保持領先地位將值得關注。在 OpenAI 公布瀏覽器消息後,谷歌股價周二一度下跌 4%,但隨後回升,收盤下跌約 1.8%,這表明投資者雖然謹慎,但並不恐慌。
更大的問題是,在谷歌自己的產品中,ChatGPT 是否能比谷歌做得更好。如果 OpenAI 能夠真正重塑瀏覽器體驗,而不是用一個附加的 ChatGPT 來重建 Chrome 瀏覽器,那麼它將再次迫使谷歌陷入創新者的兩難境地:如何在不破壞其搖錢樹的情況下進行變革。
Atlas 最受歡迎的功能之一是 "代理"--一種可以執行多步在線任務的瀏覽助手。在演示中,ChatGPT 找到了一份食譜,導航到了 Instacart,並將食材添加到購物車,如果你願意提供登入和付款信息,它甚至還能幫你結賬。這是一個很大的 "如果"。 現在負責 Brave 的 Mozilla 創始人布倫丹-艾奇(Brendan Eich)警告說,用戶應該警惕向代理瀏覽器提供私人信息,因為它們極易受到間接提示注入的影響。
現在的競爭焦點是,谷歌能以多快的速度推出自己的 Chrome 瀏覽器代理版本,以及用戶會以多快的速度相信人工智能能代表他們瀏覽互聯網。歸根結底,OpenAI 的瀏覽器要與谷歌花了二十年打造的習慣、信任和基礎設施競爭。真正的考驗並不是 ChatGPT 能否更快地瀏覽網頁,而是我們是否會足夠信任它,讓它替我們瀏覽網頁。
本周圖表
領先的人工智能助手正在努力澄清事實。根據 歐洲廣播聯盟(European Broadcasting Union)和英國廣播公司(BBC)本周發布的 最新研究 (link) ,在分析的 3000 個由人工智能生成的免費聊天機器人新聞回覆中,近一半至少存在一個重大問題,而 81% 的回覆存在某種問題 。
最大的罪魁禍首是什麼?來源。總體而言,所有重大問題中有 31% 是由於來源不正確或缺失造成的--通常是由於人工智能系統錯誤地將聲明歸屬於新聞機構。谷歌的 Gemini 2.5 Flash 是一個明顯的例外,其 72% 的回覆出現了重大來源錯誤,而 ChatGPT-4o 為 24%,Copilot 和 Perplexity 各為 15%。
對於越來越依賴人工智能聊天機器人來總結新聞的人來說,這些發現及時提醒了他們,這些系統還不是可靠的編輯。即使它們重塑了人們獲取信息的方式,也常常模糊了引用與發明之間的界限--這使得人工智能時代的媒體素養比以往任何時候都更加重要。
人工智能術語須知:重新定義人工智能
如果你曾經覺得 "AGI"--人工通用智能--現在指的是公司想讓它指什麼就指什麼,那你並不孤單。人工智能安全中心(Center for AI Safety)負責人丹-亨德里克斯(Dan Hendrycks)對此深表讚同。他的研究小組與包括 Yoshua Bengio 在內的一批受人尊敬的人工智能研究人員一起,啱啱發表了 一篇論文 (link) ,試圖明確 AGI 究竟是什麼,它又不是什麼。這項研究將 AGI 定義為:在推理、記憶、感知和速度等 10 個可測量的領域中,與受過良好教育的成年人的認知能力和熟練程度相匹配的人工智能。他們從數十年的心理學研究中調整了這一框架,甚至對當今的模型進行了評分。結果是GPT-4為27%,GPT-5為58%--令人印象深刻,但距離代表人類普通智能水平的100%標準仍有很大差距。
亨德里克斯在接受我們採訪時說,由於缺乏定義,"AGI "已經變成了一個籌款的流行詞,因此他的目標是讓這個詞變得可以衡量,這樣我們就可以 "看到人工智能到底能做什麼,還缺少什麼"。
其中最大的差距是什麼?記憶。亨德里克斯說,雖然現在的模型可以在數學競賽中取得優異成績,但在下一次對話中,它們就會忘記 "學到 "的一切。
"他說:"一個得了健忘症的工人用處不大。他認為,在人工智能發展出長期記憶並能從經驗中學習之前,無論它碾壓多少基準,都無法接近 AGI。
AI chatbots often miss the mark on news sourcing https://www.reuters.com/graphics/AI-CHATBOT/SOURCING/zdpxklamlvx/AI-chatbots-often-miss-the-mark-on-news-sourcing.png
(為便利非英文母語者,路透將其報導自動化翻譯為數種其他語言。由於自動化翻譯可能有誤,或未能包含所需語境,路透不保證自動化翻譯文本的準確性,僅是為了便利讀者而提供自動化翻譯。對於因為使用自動化翻譯功能而造成的任何損害或損失,路透不承擔任何責任。)