該研究覆蓋了在美國GDP中佔比較大的九個商業領域,涉及44個職業中的1300項工作任務。研究發現,AI模型執行職業任務的能力幾乎已與人類專業人士相當。前OpenAI政策總監、Anthropic聯合創始人Jack Clark認為,GDPval的出現,為評估AI的廣泛經濟影響提供了一個關鍵基準,其意義類似於SWE-Bench之於編程領域。一項來自OpenAI的最新評估顯示,AI在執行具有經濟價值的工作...
網頁鏈接該研究覆蓋了在美國GDP中佔比較大的九個商業領域,涉及44個職業中的1300項工作任務。研究發現,AI模型執行職業任務的能力幾乎已與人類專業人士相當。前OpenAI政策總監、Anthropic聯合創始人Jack Clark認為,GDPval的出現,為評估AI的廣泛經濟影響提供了一個關鍵基準,其意義類似於SWE-Bench之於編程領域。一項來自OpenAI的最新評估顯示,AI在執行具有經濟價值的工作...
網頁鏈接免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。