OpenAI的勁敵Anthropic發佈Claude 4系列模型,稱Opus 4爲“全球最佳編程模型”,對AI投資者而言標誌着模型能力的新紀元,可能重塑軟件開發行業格局。
除了新模型,Anthropic還宣佈,編程工具Claude Code正式上線,並提供新的功能供連接到其模型的開發者使用,包括將推理與網頁搜索和其他工具相結合的能力。
Anthropic的新發布加劇了與OpenAI、Google在頂級模型領域的競爭,爲投資者提供了重新評估AI領域競爭格局的機會。
Opus 4精於編碼 Sonnet 4較3.7版明顯提升
美東時間5月22日週四,Anthropic在公司首屆“Code with Claude”開發者大會上推出了Claude 4系列的兩款全新模型:Claude Opus 4和Claude Sonnet 4。
Anthropic將Claude Opus 4稱爲“公司迄今最強大的模型,也是全球最佳編程模型”,而Claude Sonnet 4 是Claude Sonnet 3.7版的重大升級,提供卓越的編碼和推理能力,同時更精確地響應用戶指令。
Anthropic稱,Opus 4在編碼、研究、寫作和科學發現方面突破了界限,而 Sonnet 4 作爲 Sonnet 3.7 的即時升級,爲日常用例帶來了前沿性能。
在SWE-bench軟件工程任務基準測試中,Opus 4得到72.5%的準確度成績,在Terminal-bench上達到43.2%。Sonnet 4則在SWE-bench上達到72.7%,相比得到62.3%成績的Sonnet 3.7版本有顯著提升。
Opus 4和Sonnet 4都採用了混合模式設計,既可提供幾乎即時的回應,也能進行更深入的推理思考、即擴張思維。
在Anthropic的Pro、Max、Team 和 Enterprise Claude 套餐中包含了上述兩種模型的能力,Sonnet 4模型也面向免費用戶開放。新模型均可在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用。
定價與之前的Opus 和 Sonnet 模型一樣:Opus 4 爲每百萬token輸入和輸出分別收費15美元和75 美元,Sonnet 4的百萬token輸入和輸出分別收取3美元和15 美元。
Anthropic產品負責人Scott White表示,此次發佈標誌着
“Claude從一個提供答案的工具轉變爲一個真正有能力的協作夥伴”。
超長持續工作能力:AI代理的革命性突破
Opus 4最引人注目的特點是其驚人的持續工作能力。據Anthropic介紹,該模型能夠在需要專注努力和數千步驟的長時間任務中保持穩定表現,可以連續工作數小時。
Anthropic稱,日本電商巨頭樂天(Rakuten)已驗證了Opus 4的能力,在樂天要求嚴格的一項開源重構任務中,該模型獨立運行了7小時,且這期間保持穩定的性能。
這種持久的注意力和工作能力使Opus 4特別適合複雜的編碼和問題解決場景。
代碼編輯平臺Cursor稱Opus 4爲“編程領域的最新技術,在複雜代碼庫理解方面實現了飛躍”。編程平臺Replit則表示,在跨多個文件的複雜更改方面,Opus 4取得“顯著改進”。
擴展思考與工具使用:AI的思維質變
兩款新模型都引入了“擴展思考與工具使用”功能(測試版),允許Claude在思考過程中使用網絡搜索等工具,在推理和工具使用之間交替以改進回應。這些模型還能並行使用工具,更精確地遵循指令,並在開發者授予本地文件訪問權限時展示顯著改進的記憶能力。
特別值得注意的是,Opus 4在記憶能力方面大幅超越了所有以前的模型。當開發者構建的應用程序提供Claude本地文件訪問權限時,Opus 4能夠創建和維護“記憶文件”來存儲關鍵信息,這解鎖了更好的長期任務意識、連貫性和代理任務性能。
Claude Code正式上線:AI開發新時代
在模型發佈的同時,Anthropic宣佈,在測試收到“廣泛的積極反饋”後,Claude Code正式全面推出。現在通過GitHub Actions支持後臺任務,並與VS Code和JetBrains原生集成,直接在開發者文件中顯示編輯,實現無縫結對編程。
Claude Code 由 Opus 4 和 Sonnet 4 提供支持,讓Anthropic 的大語言模型(LLM)擁有更多功能,因爲它可以編寫代碼來分析數據。用戶甚至可能不知道 Claude 在爲完成任務編寫和調試代碼,但它的編碼能力將使模型在分析大量數據時能夠運用思維。
Scott White表示:“編碼是一個快速增長、非常令人興奮的市場。”
White 任務,Claude Code 不僅適合那些希望爲旗下軟件工程師提供工具進而提高自身專業技能的公司,也適合那些可能不懂編程的人。
他舉例說,如果一位產品經理正在向團隊推薦一個點子,他們就不必僅僅創建一份文檔來解釋相關概念,而是可以找到Claude,並請 Claude 創建這個點子的原型。
AI巨頭競賽加劇:行業格局再洗牌
據彭博社報道,這次發佈來自於AI領域異常繁忙的一週,期間微軟宣佈了新的編碼代理和與Elon Musk的Grok的合作伙伴關係,Google擴大了其AI支持的搜索功能,OpenAI宣佈了65億美元的交易收購由Jony Ive領導的AI硬件初創公司io。
這表明Anthropic、Google和OpenAI之間的“最佳前沿模型”競爭正在升溫,同時對這些公司能否將當前AI技術推向新高度的疑問依然存在。
投資者視角:重新評估AI競爭格局
對投資者而言,Claude 4系列的推出標誌着AI能力的一個新紀元。特別是在編程領域,Anthropic聲稱已經取得了領先地位,這可能對軟件開發行業產生深遠影響。GitHub已表示Claude Sonnet 4將成爲GitHub Copilot中新編碼代理的基礎模型,這進一步驗證了其能力。
隨着AI競爭的加劇,投資者需要重新評估行業格局,尤其是Anthropic相對於OpenAI和Google等競爭對手的地位。Claude 4系列在編碼、推理和代理任務方面的強大表現,可能爲Anthropic贏得更多市場份額和企業客戶提供了機會。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。