據Business Insider消息,Anthropic正通過一個由約1000名人類軟件工程師參與的項目,提升Claude Code的性能。
該項目在數據標註公司Snorkel AI內部被稱為「Marlin」(馬林魚),其核心在於微調Claude Code的回答,使其能夠更接近開發人員的真實工作環境。
像Anthropic這樣的AI公司通常會將數據工作外包給諸如Snorkel之類的第三方公司,而這些第三方公司會僱佣外包人員來向AI教授各種專業領域的學科,並執行其他任務以改進模型。
兩位參與該Anthropic項目的外包人員透露,他們編寫提示詞並審查代碼的報酬為每項任務280美元(現匯率約合1902元人民幣)。他們表示,每項任務大約需要一小時,不過有些提交的內容需要與Snorkel的審批層進行多輪溝通。
在Marlin項目中,擁有軟件工程背景的外包人員被要求對兩種不同模型生產的代碼進行A/B測試。他們會比較兩組輸出,選擇自己更偏好的結果,並判斷模型是否真正達到了提示詞要求的細節程度。
一名外包人員表示,該項目旨在確保模型能夠達到提示詞中所期望的詳細程度,從本質上講,就是在訓練Claude Code生產更簡化、更易於維護的代碼。
據悉,該項目目前仍在進行中。外包人員並不知道他們所評估的是哪個版本的模型。
美股頻道更多獨家策劃、專家專欄,免費查閱>>
責任編輯:鍾離