一直与微软Office掰手腕的金山办公,能否靠AI领先?

数智前线
30 Jul

WPS灵犀=Gemini+Chrome+微软Office。

文|徐鑫 周路平

编|任晓渔

办公提效是AI大模型出现后应用最广、也是效果最显著的场景。在今年5月美国机构开展的一次大规模调研中,写作辅助和PPT制作都是排在前列的应用。而WPS作为国内最老牌的办公套件,其在AI办公上的进展一直备受外界关注。

7月27日,金山办公发布了原生Office办公智能体“WPS灵犀”,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转,而且可以在右侧的对话框中,与AI边聊边改。

同时,它还能保证PPT生成的效果,顺畅完成二次修改编排,贴合现实使用场景的体验,令不少用户感到惊喜。“不再是辅助的工具,而是正在变成了一个可控的智能助理。”有人如此形容灵犀的体验。

基于用户现实的需求,将AI能力与文档办公组件深度融合,灵犀也引领办公领域走向智能体时代。

01

办公智能体的“Aha moment”

内容创作已经是AI最基础的功能,不管是AI办公软件,还是各类通用的AI应用都具备创作生成的能力,不过此次WPS灵犀的发布,却在强调“边聊边改”,更符合真实办公场景体验。

到底实际效果如何,我们也做了上手体验。

首先演示文稿生成场景。我给灵犀下了一个指示:以深度学习技术的发展历程为主题,制作一份演讲时长30分钟左右的演讲稿,里面要有行业内的前沿动态和案例。

AI智能体在接收指令后快速对任务进行了拆解。可以先看一下它的深度思考拆解过程。

它给出的大纲条理清晰,内容丰富,完整地呈现了深度学习技术的发展阶段。而且开头、结尾以及段落之间的衔接,有很多口语化的表达,符合演讲者的身份,自然鲜活。

既然它说可以边聊边改,我也挑了一下它的毛病,要求它优化致谢部分的表达方式。

WPS灵犀理解了我的需求,并且精准定位到了致谢的位置。它还给出了修改的说明,认为可以补充相关数据,增加严谨性。

提出了这些修改意见后,在目录下方有一个挑选PPT模板选项,WPS内置了丰富且精美的模版库。

两分钟后,WPS灵犀就生成了数十页的PPT,效果令人惊喜。这份PPT不仅风格统一、排版精美,而且还插入了各种图标和图片,甚至这些图片都是根据演讲内容生成,并非是毫无关联的配图。

生成好了PPT之后,作为一个挑剔的合作者,我再次提出要求。能否跳回大纲部分,补充人机协同系统构建案例。WPS灵犀非常有耐心,它首先回溯了一遍任务,然后上网搜寻了信息,之后再次回到大纲修改了大纲内容。

大纲修改完成后点击就能生成PPT。到具体的PPT页面里,如果有不满意需要调整的地方,侧边栏的AI智能体又能出马帮忙。

比如,在某一页里无论是内容、条目数量还是格式等有问题,都能动态调整。

甚至,WPS灵犀还可以根据生成好的PPT,提供演讲脚本的生成,并配上演讲者的声音和动画,将其制作成演讲视频。

生成的文稿有两种模式。一种是可以嵌入到演示文稿的备注中,在演讲者模式里直接可以成为演讲时的提示词。也可以导出为文档,直接对着文稿介绍。

除了AI生成演示文稿和PPT,WPS灵犀在合同文书场景里的能力也令人印象深刻。

我最近租房,需要一份租房合同。在使用WPS灵犀之前,我发现市面上有很多AI助手虽然可以生成合同,但大部分都不能直接生成word,需要自己复制粘贴到word。体验割裂不说,合同本身需要有排版格式,复制到word里格式往往一团糟,很难上手即用。

WPS灵犀直接给了我一份带格式的合同,调格式的烦恼直接没有了。

这波体验下来最直观的感受是,用起来更有确定性和更可控。其亮点如下:第一,它用聊天对话的方式就把内容定了。第二,它不追求一锤子端到端搞一个看起来酷炫的东西,而是务实地认为,办公场景需要通过多轮自然语言对话,逐步让AI给用户交付一个更符合用户需求的东西。第三,它也不只是生成内容,还能交付有确定性的格式和呈现效果。

“现实生活中我们就是这么工作的。当你有一个真正的助理,最高效的沟通方式一定是你一边对着文档,一边告诉他你需要什么。”WPS助理总裁田然在WAIC演讲中说。

02

“边聊边改”,技术实现起来并不容易

相比外界的一句话生成文本或者演示文稿,WPS灵犀的新颖之处是边聊边改,实时同步结果。这个差异能看到WPS在产品理念层面,选择向贴近用户使用场景,更务实的方向演进。

“一句话生成一个完整内容,这件事并不符合日常用户的交互和使用习惯。人的创作过程,本质也是一个非线性的逐步成形,螺旋逼近成品的过程。”WPS AI PPT产品负责人陆炜俊说。

而除了产品理念贴合用户需求之外,数智前线与WPS产品技术团队的交流同时得知,颇刷大众好感的“边聊边改”实现起来并不如看起来那么容易。

资深人士介绍,市面上此前一键生成PPT的模式,本质上是把非结构的内容变成结构化的大纲,后面的动作就是套模版。

而WPS灵犀通过与用户的多轮对话来理解用户,在大纲环节确保符合用户需求。同时,这个环节相比其他一键生成模式,技术突变点在于让大脑能够行动的脚手架上,有了脚手架让大纲可以做增删改查。

这里面,大模型推理能力的升级非常关键。基模能力如果不强,没有那么强的指令遵从能力,泛化时可能就会出现幻觉,模型就容易乱编格式,编完再渲染回文档或者演示文件,效果会很糟糕。

而随着智能中枢大脑的推理能力变强,给能理解更复杂语义的大脑中枢提供一个可以增删改查的手脚,生成大纲这一步就多了一个控制节点。WPS产品团队认为,大纲编辑器是他们给行业提供的一个基建。

“它看起来像一个文档,但它不是文档,也不完全是markdown,而是我们人为定义的正文节点的一个编辑器。我们让大模型认识了这个大纲编辑器,围绕着大纲的这个增删改查的脚手架才能调动成功。”陆炜俊说。

在体验中,我们也发现,围绕着大纲内容的调整,WPS灵犀已经有非常精准的定位能力。比如我想要它调整致谢相关表达时,大模型能理解整个大纲里哪个部分是致谢,其他部分的大纲就不发生变化。

而整个PPT制作过程有三层,在内容之外,还有排版和样式。目前排版样式需要在生成的PPT文件内调整。这些调整过程目前也用到了AI能力,比如三个信息点增加成四点,点击一个按钮版式上会自动变成能容纳四层信息的样式,用户无需自己排版对齐美化。

但当下它还不是在灵犀里用聊的方式完成的。“现在还没法在全篇文档里来改细节格式,围绕着格式版式有1万个API,排列组合下来它是一个天文数字。”

WPS产品团队介绍,这是他们接下来努力的方向。要往这方向发展,有不小的难度。

这里面不止是要把组件的各种格式能力打碎,能被原子化地调度。更重要的是要让AI调用API的时候既能发挥AI的创造性,又能严谨遵循格式要求。田然认为,组件有那么多的API,尤其是表格,复杂度极其高,以什么样子的方式又得让AI能用到,同时又不会把AI去用废了。两边的都需要大量的工程工作。

据了解,目前WPS产品团队已经构建了一套新的更适合AI原生的API,它作为一种中间协议,在模型和编辑器中双向沟通,发挥模型的创造性,同时也确保产出结果在格式等层面的可控性。

不过WPS认为,他们来做这件事也有固有的优势。与市面上的其他产品相比,WPS拥有海量的用户,也围绕着Office做了几十年的技术积累。今年年初,金山办公披露,WPS Office PC版的日活设备数已经过亿。这不仅能让他们更熟悉用户的需求,也能从产品层面更好地满足需求。

“能够用好AI,还能够理解office,这就是我们跟别人不一样的地方。office有1万个API,我们接下来怎么把这1万个API能够封装为让AI能调度,这是我们幸福的烦恼。”陆炜俊说。

03

从与微软掰手腕到引领半个身位

WPS最早诞生于1988年,比微软Office先开启中文文字处理时代。双方多年来一直在交锋。不过,微软Office早年凭借兼用协议和系统捆绑销售的方式抢占了绝大部分市场,也因此通过Office办公三件套定义了文档的格式、成为了行业标准。

而这些年,WPS通过布局移动端,持续在兼容性和生态上下功夫,也逐渐夺回了本土市场。2025年一季报的数据显示,WPS Office全球月活设备数达到6.47亿。

进入AI时代,新的竞争格局仍在持续变化。在WPS AI 1.0时代,外界依稀还能看到微软的影子。但随着WPS AI 3.0的原生Office智能体灵犀的发布,金山办公在PPT生成和文档生成等方面的体验已经走在了前列,成为AI办公领域的先锋者。

在金山办公助理总裁田然看来,微软Copilot的产品形态,属于是WPS AI 3.0之前的版本。

一位金山办公内部人士告诉数智前线,金山办公WPS与微软Office在AI上做的事情有相似之处,都是给用户提供更加智能化的操作,但两者的整体技术路线其实不完全相同,微软现有的产品更偏向基于现有功能,然后加上AI能力。

而金山办公会从更加底层,把程序最底层的API暴露给模型,然后模型用代码的方式去生成,这更能保证AI生成的准确性和覆盖度,“但这样的技术难度曲线就会比较陡峭”。

在田然看来,WPS灵犀做的事情和Cursor的逻辑非常相似,“只不过Cursor是给程序员做,我们是给所有的文档工作者做。”

程序员写代码需要在IDE的环境中实现,而Cursor做的最核心的事情是把大模型的能力与vscode编辑器的能力做了深度融合。这种能在真正的编译运行环境实际使用的代码与早期AI生成的代码是两回事。

WPS灵犀则是在Word或者PPT的编辑器里面来实现交互过程,尝试推动AI和办公软件的深度融合,“不是把软件的10000个API教给AI,而是针对场景做AI和软件的双向改造,软件为AI设计专有能力,同时教会AI跟软件深度交流,最终依靠用户、软件、AI之间多轮交流,输出真正可用的内容。”

田然将WPS灵犀形容为融合了Gemini、Chrome和微软的能力,做到了把用户真正想要的文档形式跟AI之间的交互,“这个市场上今天仅此一家”。

除了技术路线上的不同,WPS之所以能在AI体验上做出惊喜,也跟金山办公一直以用户需求为中心的务实心态有很大关系。

金山办公反复强调的一点是,不会去发布看起来酷炫但落不了地的功能,而是基于海量用户的反馈去解决已经存在的痛点和需求。相反,市面上很多企业做产品的思路是先做一个酷炫的Demo,推向市场,进而拿到融资。

这种务实也体现在金山办公对自身的定位上。金山办公从一开始就明确不做基础大模型,而是基于业内最优秀的大模型,集中精力放在AI的应用落地。

今年初,金山办公首次发布了五年战略,金山办公决定将适当放宽对WPS Office的收入增长目标,转而把用户体验置于更优先的位置,同时将“WPS AI做成办公领域的AI引领者”。而WPS灵犀也在刚刚结束的2025世界人工智能大会上,获评为“镇馆之宝”。

回顾金山办公的37年发展历程,它仿佛一场穿越重重困难的长征。但愿意花笨功夫,愿意根据用户真实需求去踏踏实实做产品的金山办公最终生存下来,且一步步走向壮大。WPS这一次推出原生Office智能体灵犀,是WPS在AI的大时代,成为AI办公先锋者的关键。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10