據悉,商湯科技即將在12月15日開始舉辦產品發佈周。從近期開源的多模態架構NEO到實時數字人技術SekoTalk,不難看出商湯正展現出一條清晰的路徑:以底層創新推動產品體驗升級,讓實用主義成為AI落地的核心邏輯。
AI應用技術地基:NEO架構重構多模態效能,SekoTalk重塑數字人交互
商湯開源的NEO架構從底層重新設計了多模態模型的「骨架」,突破了此前業內拼湊式方案存在的效率低、融合淺瓶頸,實現了視覺與語言的深度統一,該架構僅需業界十分之一的數據量即可達到旗艦模型性能。
這種「降溫增效」的特性,讓高質量多模態從高耗能的大型模型向輕量化部署邁出實質性一步,這將催生更多實用、好用的C端產品,讓AI普惠到各個細分生產生活場景。
如果說NEO架構體現了商湯在基礎模型層面的深耕,那麼SekoTalk技術則展現了其在應用層的精準洞察。SekoTalk實現了多語言環境下的精準脣形同步和長視頻生成的穩定表現,在8卡服務器上達到24fps的生成速度,將首幀延遲降至3.5秒,使實時交互數字人從概念走向實用,解決了行業長期面臨的「嘴不對音」、延遲漂移等痛點。
這一突破不僅指向視頻製作、虛擬偶像等內容市場,更為情感陪伴等交互場景開闢了新空間。
從技術蓄力到產品價值,實用主義構建AI產品邏輯
除此之外,近期商湯還迎來了「1+X」新成員——劍指具身智能場景化商業落地的「大曉機器人」,近期頻頻的技術動作可見商湯正在構建的產品邏輯:
以底層架構創新降低AI使用門檻,以場景化技術解決實際痛點。這種「實用主義」思路,標誌着AI企業從追逐參數規模向關注用戶價值的轉變。
技術研發的長期主義,最終需要穿透到用戶可感知的產品價值。商湯近期的技術蓄力,正在具象化為日常使用體驗的提升。從模型推理效能的顯著提升,到數字人交互的自然流暢,這些技術細節的進步,實則是AI技術真正融入產業的關鍵一步。
在產品發佈周即將到來之際,期待商湯將展示更多如何將前沿技術轉化為實用產品的思考,為行業帶來新的啓發。