阿里國際副總裁張凱夫:人類跟AI交流,告訴它不要做什麼特別重要

市場資訊
07-28

  炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛力主題機會!

(來源:觀察者網)

“雖然OpenAI的Deep Research能力很強,但其適合做廣泛的搜索和很長的報告。對於出口商品HS Code這樣一個具體要求精確答案的任務,正確率卻只有5%。我們在垂直數據庫上,做了工具的減法,以及上下文工程。這個垂直Deep Research範式的HS Code判定工具,準確率可以做到80%。”

在2025世界人工智能大會期間跟媒體交流的時候,阿里國際副總裁、阿里國際AI Business負責人張凱夫如是說。

近半年來,包括Deep Research和Manus在內的各類智能體產品紛紛湧現,AI Agent儼然已經成爲人工智能賽道的“必爭之地”。近期以來,面向跨境貿易、跨境電商等實際場景,阿里國際數字商業集團推出了多款智能體應用產品,如智能退款agent、海關編碼HScode agent以及在線招商agent等,在行業裏獲得關注。

7月26日,2025世界人工智能大會卓越人工智能引領者SAIL獎公佈,阿里國際跨境電商AI解決方案Marco斬獲本屆SAIL之星,成爲該領域的首個獲得者。在同觀察者網等媒體交流時,張凱夫多次談到了AI Agent的發展。張凱夫認爲,在很多實際功能上,垂直Agent的機會可能比垂直模型的機會還要大。

爲了服務更多出海貿易商家,阿里國際AI Business開始做中國商家自己的“Deep Research”和垂直AI Agent。

“海關編碼HScode agent,商家自己去匹配的準確率比較低,我們自己的Agent的正確率能到80%。”談到研發經驗,張凱夫表示,“先做減法,把數據限制好。只讓Agent去關注相關部門的數據,而不是去互聯網上亂搜;在Agent的思考進程裏(thinking process),我們也使用了較爲領先的模型和優質的案例。”

“人跟AI交流,給它定好約束條件,告訴它不要幹什麼特別重要。”

人類跟AI交流,告訴它不要做什麼特別重要

“通用”和“垂直”的路線之爭,一直是人工智能領域的母命題。

2023年,國內業界、學界圍繞“做基礎大模型,還是做垂直/行業大模型”進行了不少討論。有的從業者認爲,要抓緊基礎大模型的研究,在底座模型上奮力追趕,尤其是要擺脫對國外開源模型的依賴;也有從業者認爲,中國市場巨大、數據豐富,應用場景多元,可以用應用發展來帶動模型進步,走一條“農村包圍城市”的路線。

從DeepSeek攪動全球風雲,到各行各業的專業大模型集體湧現,事實上,中國在這兩條路上走得其實都不錯。

近年來,人工智能領域的競爭開始從類GPT式的問答對話,向具體場景的智能體Agent遷移。從OpenAI的Deep Research,到轟動一時的Manus,能夠調用多種能力,解決具體問題的智能體,成爲行業競相追逐的焦點。這也讓“通用”和“垂直”的路線差異,再一次顯現。

此時此刻,恰如彼時彼刻。

談到行業觀察,阿里國際副總裁、阿里國際AI Business負責人張凱夫對觀察者網等媒體表示,AI應用領域已經隨着行業從AIGC(生成式人工智能)走向了Agent(智能體):以前的應用很多是AIGC,比如生成圖、搞翻譯、弄創意;今年更多是智能體,比如硅谷很火的BD agent,去找中小企業的聯繫方式;合規Agent,從厚厚的法律材料中尋找合規相關內容;比如營銷Agent,根據客戶需要去各種社交媒體發帖等等——這些過程都是自動的。

正如上文中所舉的“海關編碼案例”一樣,在張凱夫看來,在Agent時代,很多專業領域的垂直Agent更有機會給人們帶來的巨大收益;相反,通用型的AI Agent,表現反而沒有那麼好——OpenAI Deep Research不能搞定的專業工作,一個更加接近行業的垂直Agent可能就能處理得很好。

“最近硅谷很火的概念是context engineering(語境工程,或上下文工程),我們用一個模型,語境(context)非常重要。現在我們做智能體也是一樣,語境的約束特別重要,有時候你餵給它(Agent)的東西越多越不好,你一定要非常有針對性地餵給它一些內容。”

張凱夫進一步表示,現在人類和AI交流,給它定好約束條件,告訴它不要幹什麼特別重要——包括AI coding(用AI寫代碼)。“想讓AI幹嘛,大家都可以表達,但真正地核心在於讓AI明確,解決這個問題的時候不是要新建代碼文件,而是找到對應的具體代碼去修改。如果沒有這個約束條件,代碼庫就會越來越大,到後面一塌糊塗。”

“我們做一個Agent也是一樣的,語境縮減和精準選擇是非常重要的一件事情。”

阿里國際AI Business算法負責人駱衛華補充道,Deep Research等通用性Agent,在解決很多通用性問答時是沒問題的。甚至通過底座模型能力,可以通過prompt(關鍵提示詞)調優來獲得更好的結果。但是真正落地到非常專業、垂直的領域,通用型Agent是不夠用的,比如在海關編碼HScode上,它就是隻有個位數的正確率。

“但是,如果我們通過引入更多的知識庫——既包括我們收集的規則,也包括一些判例,甚至包括一些已有的case(案例)——有一些歷史的、標註過的,正確的或者錯誤的case,用這些具體的專業知識去強化Agent。後面我們發現,他們對agent效果的提升是非常大的,是幾十個點的提升。”

張凱夫認爲,整體來看,垂直Agent的發展,對當前的國內外AI Agent生態是一個非常好的事情。在一些不需要那麼精確的問題上,ChatBot或者Deep Research提供的能力,其實也夠了;但在具體的問題上,在細分的領域上,實際上還有千千萬的問題可以通過垂直Agent解決——這也是垂直Agent的機會。

日均10億次調用,中國跨境電商成爲第一個實現規模級AI應用的行業

相比於通用模型談概念、講參數,更貼近中國普通人經營實際的是,海關編碼HScodeAgent等國產垂直Agent,正在增強中國中小企業的競爭力。數據顯示,僅阿里國際旗下的AI Business團隊,其提供的AI能力,可以幫中小企業解決60多個電商場景中遇到的問題,並在不同環節,帶來1%-30%不等的顯著提升。

正如我們之前訪談中所觀察到的一樣:越是中小企業,越能從AI的應用中獲益。

公開資料顯示,阿里國際的所有電商平臺均已應用AI,已服務了超50萬賣家,形成了以服務中小企業出海爲核心,覆蓋全球多元市場、多種電商模式的規模級AI應用。截至本月(2025年7月),阿里國際AI服務的調用量每兩個月就會翻一番,平均日調用量已突破10億次。這使得跨境電商成爲第一個實現規模級AI應用的行業。

內部報告顯示,過去一年,國內商家使用頻次最高的AI功能分別是:圖文翻譯、圖像識別並完善商品信息、營銷文案生成。其中,翻譯在去年底實現了全面從小模型向大模型的轉換。在歐洲TOP語種中,因爲翻譯效果的提升,消費者滿意度提升了30%;在SEO場景下,AI提供的SEO佔到了整體SEO的近4成,未來有望達到一半甚至更高。

Agent時代,國產自研的AI產品,進一步完善了普通中國商家應對風險和變化的能力。

以海關編碼HS code(Harmonized System Code)爲例。HS Code是國際通用的商品分類編碼體系,由世界海關組織(WCO)制定並維護。它通過統一的分類規則,將全球貿易商品分爲5000多種品目,每個商品類別由6位數字編碼表示,是國際貿易、海關清關、關稅徵收和貿易統計的基礎工具。

HS Code在國際貿易中極其重要,關係到商家的合規和效率。但並非每個企業都能擁有自己的HS Code顧問。

AI Agent無疑爲這個問題提供了更多解。例如阿里國際旗下的海關編碼HS code agent,可以利用Reasoning模型(推理模型)的Planning(任務拆解&步驟規劃)、Tool Use(工具調用)、Reflection(自我迭代)能力,通過多輪調用工具不斷自主探索,從工作環境中獲取更爲精確的信息,並不斷更新步驟,以得到導向正確答案的路徑。

數據顯示,在HS code agent的幫助下,跨境商家們對10位HS code填寫準確率提升了23%。

不過,談到AI Agent的“未來”,張凱夫表示,做“最通用的”和“最垂直的”,其實都是可以的——最重要的是研發者和使用者明確人類使用AI的場景。“做非常通用的智能體,類似OpenAI ChatBot,沒有任何問題;或者做特別垂直的,把自己專業領域的知識弄得非常明白——比較讓人害怕的是夾在中間,因爲夾在中間沒有壁壘。”

和大模型時代,很多從業者堅信“全球競逐基礎大模型的,最終只有個位數玩家”的研判類似;在對話的最後,張凱夫也關注理性競爭和投入的問題。“現在的行業格局,能做出特別通用的AI Agent的,全世界只有少數幾家企業。龐大的機會依然在垂直領域。”

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10