圖片來源@pixabay
AI編程領域開始進入混戰模式,大廠也在開啓“降維打擊”。
近期,先是OpenAI宣佈Codex Agent編程模式,微軟正式開源GitHub Copilot Extension for VS Code項目,而後谷歌就公佈其AI編程Agent工具Jules私有預覽版,緊接着大模型創企Anthropic也正式發佈新一代模型:Claude Opus 4和Claude Sonnet 4,作爲面向AI編程能力的最強模型加持。
這些動作背後其實都在共同指向一類對手:當前最熱門的AI編程助手Cursor、Windsurf等,這些風頭正勁的創業企業在別人的規則下,如何繼續玩下去?對於微軟和谷歌等大廠而言,AI編程有利於補強雲服務生態黏性。對於同時提供B端和C端服務的大模型公司,提供擅長編碼任務的模型+下探到Agent,可能是在大模型商業化路徑上的一次重大機會點。
異步+混合
微軟對於AI編程的佈局更爲體系化,圍繞生態佈局,而谷歌從近期的打法上看,則更圍繞產品服務。
對於微軟而言,GitHub Copilot是自2021年起作爲主流集成開發環境IDE如VS Code的插件而提供給用戶。因此開源GitHub Copilot Extension for VS Code的核心第一步其實就先將插件開源。據微軟團隊所述,接下來幾個月內,還要將GitHub Copilot擴展的AI功能引入到VS Code開源存儲庫。也就是說,後續開發者基於VS Code無需插件就可以體驗到GitHub Copilot功能。
對於這一點,微軟的解釋是:通過開源GitHub Copilot插件,能夠與更大的社區合作,並更快推向市場,與AI編程軟件開發生命週期保持一致。
微軟此舉可能意在與Cursor競爭,畢竟Cursor是對VS Code進行魔改了,雖然耗費了大量技術和工程能力,但從結果上看,Cursor獲得了大量用戶的歡迎,這顯然對微軟VS Code的開源生態帶來了不小觸動。
此前Wing VC合夥人Zachary DeWitt在其專欄中提醒道:“微軟也可能簡單地切斷Cursor和競爭對手與VS Code核心API的連接或更改條款,使其更難在更新的基礎上構建。Cursor對VS Code的依賴顯示了建立在他人平臺上的不穩定性。”
如今來看,大企業支持開源的核心目的是構建自己的生態圈,吸引高質量開發者和高質量代碼貢獻,但這並不意味着開源不會存在商業衝突。從最近修改VS Code插件許可協議就能明顯看出微軟的不滿,着手生態戰是必然。
再看谷歌。如果不是I/O大會,外界對谷歌的印象還停留在:遭遇美國司法部的反壟斷訴訟案,以及對AI搜索市場的格局影響性上。
最近半年,谷歌對AI編程也在暗戳戳佈局,先是對其AI編程助手Gemini Code Assist進行免費,又或者推出新的人工智能集成開發環境Firebase Studio。不過直到現在,谷歌還沒有推出一款能夠引領此次AI編程潮流的重量級產品。
去年12月,伴隨Gemini 2.0大模型發佈亮相,谷歌就發佈了AI編程Agent代理 Jules。此次升級後,Jules則基於Gemini 2.5 Pro大模型,針對編碼能力進行優化。
據谷歌官方介紹,Jules可以將複雜的任務分解成更小的步驟,根據用戶指令進行調整,並運行單元測試來驗證其工作。Jules並非一款簡單的代碼自動補全工具,其功能覆蓋了從開發到測試的多個環節,能夠在雲端啓用虛擬機、複製GitHub倉庫、規劃多步驟開發任務,並自動執行包括Bug修復、版本升級、測試編寫以及代碼優化等操作。最終,Jules會生成Pull Request(PR)供開發者審查,確保代碼質量與項目進度。
不過,此次Jules升級後最大的不同的是聚焦“異步任務”編碼,這與此前所熟知的“實時協作”不同。例如,Cursor和Windsurf這些工具通常與開發人員需要實時協作,在輸入代碼時提供代碼建議或重構代碼,本質上充當了IDE角色。而“異步任務”則意味着開發者無需逐行交互地工作,而是爲 Agent分配一個特定的、可能很複雜的編碼任務,然後Agent將接管該任務,在後臺進行獨立處理,並在完成工作後呈現。
值得注意的是,微軟本週宣佈GitHub Copilot升級爲全功能編程Agent,同樣具備“異步任務”的自主代理模式。Copilot Agent最初於今年2月推出預覽版。
調用Copilot Agent後,開發者可分析整個代碼庫、跨文件編輯、生成和運行測試、修復錯誤,甚至建議終端命令,並在代碼投入生產之前幫助解決這些問題,所有這些都只需一個提示即可完成。
目前Agent功能是直接嵌入到GitHub Copilot中,一旦用戶分配任務,該Agent就會開始工作。
不過這在谷歌看來,二者產品還是有所不同:Copilot Agent類似於單個開發人員獨自執行計劃,而Gemini則採用“混合Agent”方法,需要多個專業Agent(如開發人員、測試人員和安全分析師)協同工作。這些Agent本質上是“彼此對抗的合作者,以便檢查彼此的工作”,類似於聊天室裏的虛擬團隊。
同樣在本週,OpenAI發佈Codex Agent版本,由新模型codex-1加持(codex-1是 OpenAI o3的一個版本,針對軟件工程進行了優化),不僅能在雲端沙盒環境中安全地並行處理多項任務,而且通過與GitHub無縫集成。
OpenAI認爲,異步多Agent將成爲生產高質量軟件的默認方式,實時和異步這兩種模式將融合成一個統一的工作流程,讓開發者能夠在 IDE 和日常工具中與 AI 無縫協作。爲此針對Agent模式,OpenAI也在計劃構建一套工具,能同時支持實時協作和異步任務。
從當前幾家的行動路徑上看,異步+混合這種模式,由於更接近於自主編碼的早期願景,也正成爲接下來AI編程產品的探索方向之一。
當大模型廠商下場做編程應用
當然,眼下眼熱的可不只是微軟、谷歌等大廠,大模型廠商也在暗自發力。
AI編程作爲OpenAI ChatGPT的一大優勢,也是超過1500萬人訂閱的核心原因之一。尤其是OpenAI的Codex,最初它只是一個編程模型,但現在來看它能提供的已經是一個能夠在獨立沙箱中編寫代碼、修復錯誤並回答代碼庫問題的編程助手。
Anthropic的Claude模型也在遵循這一節奏。此前,基於Claude進行軟件開發已經佔其所有交互的十分之一以上,Claude 3.5 Sonnet就因爲擅長編碼任務,並且對軟件工程原理的出色掌握和應對複雜編程挑戰的能力而被開發人員廣泛使用,包括Cursor等AI編程產品就主要基於Claude 3.5 Sonne提供服務。而微軟爲了不依賴Codex,也在今年宣佈爲開發者引入多模型選擇,其中就包括Claude 3.5 Sonnet。
據Anthropic 首席科學官賈裏德·卡普蘭 (Jared Kaplan) 表示,Anthropic去年年底就停止了對聊天機器人的投資,轉而專注於提高Claude執行復雜任務的能力,甚至編寫整個代碼庫。
而此次Anthropic將Claude Opus 4和Claude Sonnet 4升級,均針對編程能力進行了優化。與此同時,Anthropic還發布AI編程助手Claude Code,通過與VS Code和JetBrains等主流IDE集成,並基於自家的Claude Opus 4模型,可直接嵌入到用戶業務流中。
結合當前水平來看,AI編程產品發展具有以下四個階段:
一是預測文本,用於簡單的代碼補全。
二是聊天,用於編碼任務的人工智能輔助對話。
三是協作“氛圍編碼”,使用人工智能進行廣泛、協調的代碼更改。
四是Agent代理模式,人工智能在後臺自主運行,可能在沒有直接監督的情況下做出改變。
顯然,具備了編程模型能力的大模型廠商很快也都會走完這一輪產品迭代。當微軟有了GitHub Copilot Agent,谷歌上線Jules,Anthropic這類大模型廠商的動作可能不遠了。
可能現在最慌的還是Cursor、Devin等上層應用廠商了。Cursor其實也在留有後手,值得一提的是,去年Cursor的開發商Anysphere推出了自研Cursor-Fast,其代碼生成能力據稱介於GPT-3.5與GPT-4之間。
當AI編程競賽進入混戰模式,模型能力正成爲一切不確定性中的確定因素。從第一性原理出發,模型性能的強弱決定了競爭力,儘管開發者可根據場景選擇最適合的基礎模型,但最終只會選擇一兩個好的大模型。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。