2025年开年以来,以DeepSeek、宇树科技为代表的科技新贵正在重塑AI圈的竞争格局,风起云涌,激战正酣,而对于那些曾经在上一个时代破浪的AI选手来说,如何挤身新浪潮,显得尤为迫切。
4月10日下午,上海西岸,一艘又一艘的船驶过黄埔江,风起时,沿着滚滚江水急速顺流而下。与此同时,位于岸边的西岸大剧院内,上一代老牌AI选手代表——商汤科技,正在举办“商汤2025技术交流日”活动。活动现场,商汤发布了新版本“商汤日日新 SenseNova V6”多模态融合大模型,这是一款具备最长64K思维链、数理分析、多模态深度推理、全局记忆等能力的多模态大模型,而多模态正是2024年以来商汤主要的发力方向之一。同时,商汤还推出了“商汤大装置 SenseCore 2.0”,这是自2021年大装置发布以来首次全新升级。(虎嗅注:商汤大装置,即提供包括底层计算基础设施服务IaaS、深度学习平台服务PaaS,以及模型部署及推理服务MaaS在内的三大服务。简单来说就是它通过整合算力、算法、数据,提供一个基础设施解决方案,以降低模型开发和应用的门槛。)
从时间节点来看,这次是商汤科技减重瘦身、转型重组后的首次技术交流。
回顾过去近一年的时间,商汤科技很忙。
作为一家AI原生公司,商汤科技在上一波AI浪潮中,凭借计算机视觉识别构建起来的护城墙,在这新一轮的AI竞争格局中,显得有些吃力。新的叙事方式下,如何拿到新时代的船票,商汤科技也一直在思考、摸索,做了不少尝试。
先是2023年,商汤科技开始把业务重心转向生成式AI,并将业务重组调整为生成式AI、传统AI和智能汽车三个板块。
去年10月,商汤科技正式发布“大装置-大模型-应用”三位一体战略,并同步构建更为集中和高效的组织结构。
紧接着一个月后,商汤科技董事长兼CEO徐立又在内部信中,再次减重瘦身,重申生成式AI的重要性,建立“1+X”架构,业务重组为生成式AI、智能汽车及视觉AI。
而商汤科技的生成式AI相关业务,包括提供算力的“大装置”、AI基础模型和应用。其中,商汤的大装置是在2021年底投入使用,这也是它区别于其他AI公司的一大重要特点,其实在过去很长一段时间里,AI公司是否需要自建基础设施都是一个非共识,而商汤也因此走出了一条独特的商业道路。
据商汤科技联合创始人、大装置事业群总裁杨帆透露,依靠商汤大装置,商汤的多模态推理应用的成本大幅降低。毋庸置疑的是,新一波AI浪潮中,大模型的技术迭代、场景化的落地应用,都离不开一个好的AI Infra的支撑。(虎嗅注:AI Infra即将AI三要素“算力、算法、数据”都进行基础设施化,为模型整个生产周期提供全套标准化的工具链,以降低模型开发应用成本,提高效率。)
虎嗅与杨帆进行了交流,他分享了关于商汤大装置技术发展与迭代的路径以及对于行业的思考。以下为交流实录,部分内容略有删减:
虎嗅:当前在算力基础设施这一块,一些大厂巨头也在进行千亿级别的投入,那在这样的竞争格局中,商汤科技想怎么做?
杨帆:商汤的优势就在于我们懂模型、懂客户。这几年一个很强烈的感受是,包括我们从2023年下半年到2024年年初开始提出轻重资产的比例,要加大轻资产运营,之所以这样做原因很明显,就是当前芯片硬件大概3年一迭代,而下游用户的模型大概是三个月一迭代,一线用户肯定期待用更新的硬件资源去迭代最新的技术。
从这个角度上可以看出,资产的轻量化其实对客户来说是没有包袱的,所以我们试着在把轻资产的比例加大。
而供给端的变化是,下游需求端模型的技术、应用迭代速度非常快,而上游的供应链,不管是英伟达还是国产芯片,从产能到成本再到市场供应水平也都在一个高速变化中。
当市场,特别是上下游同时都在多变的时候,保持系统的灵活性,以及针对不同类型的客户做出更清晰化的肖像描述,并且给客户提供一个更符合他诉求的方案。
我认为这件事情的重要性是要高过于整个的资产规模的。
虎嗅:商汤科技的大装置是从2021年就开始做的,中间也有一些升级,但为何是在今年这一时间点进行这样一个大的量级的升级?
杨帆:这确实是因为我们在系统架构上做了一个比较大的升级。
我们是2021年开始做(大装置),但是市场真正起规模是生成AI起来之后。当时的状态其实是整个市场都没有特别好的、成熟的产品和方案,包括商汤自己也是,虽然很早就做了一些千卡的实验,但是在服务过程中还是会有很多的问题,因为芯片也在迭代,真正在实用场景上跑起来,会有很多意想不到的问题。所以,在那个点上我们去做的时候,更多就是跟着用户的需求去迭代产品功能。
而如今的局面有很大的不同了,这两年整个市场趋势发生了很大的改变。
虎嗅:具体是哪些改变?体现在哪些方面?
杨帆:我觉得主要有两点,第一个就是开源会越来越成为主流,或者说有越来越大的影响力。这种开源不仅仅是模型的开源,还会带动各种各样的中间件和工具的开源组件的出现。
所以当我们看到这成为一种趋势的时候,或者说我们在一年前早于市场的时候就看到这种趋势的时候,我们做的一个重要决策就是要让整个体系的框架具备一个更好的融合系统,对于整个开源体系的兼容,这是很重要的。
第二个是,AI中越来越多的训练,前置的生产环节进入到应用环节,对于Infra推出了很多新的挑战,像是一些弹性、快速部署、性能优化等。其实这样的事情我们之前也都做了,但是永远是这样的,技术迭代只有当你有足够多的用户(才会发生),就是当他的业务规模、用户数量都起来的时候,你会发现他会给你提出更多的需求,这些需求会引导你的核心技术进行迭代。
其实我们的SenseCore 2.0大概是从大半年前开始做的,我们在那个时间点上看到了这两个趋势,认为接下来三年整个市场会与过去三年有很大不一样,那我们的整个产品体系就要应对这一趋势做出比较大的改变。
虎嗅:其实在很长一段时间内,对于AI公司是否要自建算力基础设施,都是一种非共识,而商汤科技是其中比较典型的一个案例,那你觉得现在这还是一种非共识吗?或者说达到一种怎样的共识?
杨帆:共识就是不应该自建(笑),只有足够大的厂商才会去自建。或者更重要的问题在于怎么定义AI 公司,比如商汤成立10年,过去大家有很多做得好的地方,也有很多做得不好的地方。
虎嗅:那你认为该如何定义AI公司,或者说下一代更健康的AI公司应该长成什么样?
杨帆:我觉得反而应该是像我们的一些客户一样,更贴某一个行业、某一个场景,因为只有这样他的商业模式才更容易确定下来,从而更大程度上解决盈利问题,这是大部分公司都存在的挑战。
AI是个通用技术,所以AI公司的定义如果从商业化的角度长期来看,更健康的应该是有更多、更小、更专注在某一个细分场景,去提供一个以AI为关键能力的产品和服务的公司,且这样的公司大量存在,这才是整个行业五年或者十年之后该有的样子。
而对于这些人而言,毫无疑问,他们没有必要或者说没有极强的诉求去自建基础设施,因为他更重要的事情是给他的客户提供一个更好的产品和服务。
这个过程中AI可能是关键能力,但不一定是他的出发点,而对于AI本身的技术迭代来说,比如如今模型的迭代、数据的积累,他们对资源的需求是在持续增长的,那越是这种情况,他就越应该采用第三方的服务形式去降低成本,因为这不是他的核心。
他的核心在于如何把AI的这一点点创新或者优势能力嵌入到他的产品和解决方案中,整个未来会是市场的主流。
当然,对于一些头部大厂,包括一些创新龙头公司来说,他们确实会更加倾向于自建,因为规模足够大,在这件事情上可以带来足够多的(收益)。
而从我国未来的经济发展上看,整体上需要往高质量发展转型,核心的抓手在于科技创新,那如果中间最重要、最有效的一个元素是AI的话,那五年、十年之后市场上100家公司里面应该99家真正的AI公司,那我们的目标就是去服务这些公司。
虎嗅:去年商汤提出“大装置-大模型-应用”三位一体战略,那可以结合这次的产品更新升级做一个解释,它们彼此之间如何联动?
杨帆:首先它们相互促进。
比如站在大装置的角度来看,如果我想要提供一个好的AI Infra,那我就要知道用户是有什么需求,那在商汤自己的模型研究迭代中,就像前面提到的,会给你提出各种需求,而在这种需求中,如果把很多东西标准化之后,就会成为市场化的东西。
应用也是一样,模型可能更多的是涉及模型的训练、研发、生产,那模型的使用阶段其实就与应用密切相关。
比如当我们去探索一个新的细分场景——文生图,我们会先用商汤自己的文生图产品,根据他们的数据、调用量的变化情况等,去看如何给客户提供一个更好的服务。
反过来,更好的AI Infra也肯定会支撑(我们自身)的模型技术研发、衡量应用的场景化等。
虎嗅:从商汤整体的AGI目标来看,大装置的战略意义是什么?
杨帆:首先,我们对于模型、应用的认知和Know-How,其实是能够帮助大装置形成更好的差异化优势,这种差异化优势在市场上的表现就是能挣更多的钱,因为大家都知道搞模型研发投入是非常巨大,那大装置的利润越好,就越能支持商汤整体持续的技术研发和迭代,这是一定的。
反过来,单纯从技术上来看,模型的迭代也需要一个好的Infra配合、支撑。我们在模型训练过程中,有时会需要一些针对性,甚至是定制化的Infra改进,那只有当你有一个更大的平台的时候,对这样的改进响应也会更好。
而如今大模型的应用,我觉得很多场景都没有过性价比的生死线,所以会看到很多应用,有一类是砸钱拉流量,因为可能是面向C端的,砸得起钱,不追求性价比、算力。
但如果回到B端服务市场,你会发现今天的很多应用都还处于早期迭代阶段,技术可能达到60分或80分,但性价比都还没有做到一个比较好的状态。
那我们做大装置其实很重要的一个价值就是,我们能给客户提供好的性价比,那当然也能给商汤自己的模型应用提供好的性价比的支撑,这件事情对于未来它在B端市场的竞争力会有一个很大的保障。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.