阿里千问你别太荒谬!连漫画PPT都能一键生成?我以前那些夜真是白熬了

量子位
Feb 15

梦瑶 发自 凹非寺

量子位 | 公众号 QbitAI

太太太太卷了!!!

千问前脚刚把Qwen-Image-2.0甩出来,后脚就又放大招,冲着牛马党学生党的“痛处”下手了——

就在这两天,重磅发布了AI PPT生成工具:Qwen AI Slides(幻灯片),据说从内容结构到视觉配图,一套全包……

好嘛!这么刚需的本事,我肯定坐不住,我干脆替大家上手搓了一把!

最近科技圈最火的无疑是OpenClaw,我直接让AI做个科普漫画PPT,赛博感超强,一下就有硅基入侵内味儿了!

咱再来应应景,让AI做一份春运行程注意事项PPT,别说这手绘风格还真有一套,回家过年氛围感直接拉满:

再来看这个大英博物馆展馆介绍,从帕特农神庙雕塑到木乃伊都用真实图片铺陈,历史质感也能稳稳拿住,666~

这波实测下来,最大的感受是:生不逢时啊生不逢时,要是当年上学就有这种辅助,做作业写汇报哪还用熬夜硬肝???

不废话,产品表现具体咋样,咱直接拿实测说话!!!

内容生成能力考一考

我不知道大家是不是也有同感,上学和工作的时候只要一听到“要做PPT”,脑子里立刻冒出三个问号:

每页到底要写点啥?咋排版合适啊?选啥模板好看捏?(手搓时代心路历程…

乍一看像是三件事是吧,其实如果仔细掰开一看,它们核心都是同一件事儿——那就是内容创作。(doge

哪怕现在有各种AI工具号称能一键生成PPT,能不能把内容讲清楚、讲有逻辑且画面美观,才是真正的硬标准。

所以,咱直接从语义理解、文本渲染、排版设计三个part实打实测一波,看看这AI的PPT内容生成能力到底能不能打!!!

语义理解能力

AI能不能听懂我们的指令,几乎决定了PPT最后效果夯还是孬。

在输入形式上,千问PPT支持三种方式:大白话提示词、复杂提示词、上传文档。

为了更直观地对比简单提示词和复杂提示词下模型的语义理解能力,这次我们用同一个案例进行测试——让AI做四大发明的课件PPT。

先跑一个“大白话”版本的懒人简单提示词:做一个介绍中国古代四大发明的PPT,用来上历史课。

在没有明确页数要求的情况下,AI默认产出了10页内容,整体篇幅不算多,更接近一份小学课堂汇报的体量,还算ok。

内容结构上,AI把PPT分为了什么是四大发明、四大发明的影响、思考与启示三个大板块,基本符合历史科普的常见表达逻辑。

但其实最让我意外的是“生图”,在提示词几乎没给细节的前提下,AI主动生成了信息图漫画,把造纸术的历史演进过程画成手绘时间线,这波确实有点超出我预期。

(ps:这个PPT工具用到了最新的Qwen-Image-2.0模型,所以生图质量如此能打也就不难怪了…)

接着我们提高难度,用更细致的“复杂提示词”重新roll一遍:

从生成的效果来看,图文比例明显更合理,页面信息层次也清晰不少,相比一句话的简单指令,整体完成度确实提升了一个level:

语义遵循上,我特意强“表达不要太学术化”,最终成品确实偏科普口吻,图示和案例占比明显高于大段文字,阅读压力不大。

此外,原提示词里给出的“背景—原理—改进过程—应用—影响”这五个章节结构,AI也做到完整复现。

逻辑从起源讲到现实意义,递进关系还是比较清晰的:

当然了,也有一些小问题存在的。

不知道是不是受限于页数的原因,我自认为如果把“历史应用”和“全球影响”分成两页去讲信息度会更高一些。

此外,在技术原理与蔡伦改进这页的重点,我是觉得图示标注的不够明确,不知道图示在讲什么,也没有顺序感,感觉如果有图注文字会更好:

整体来说,AI的语义遵循理解能力还是不错的,对提示词中的结构要求也能准确拆解并执行,提示词中提到的需求都能满足到位~

我的建议是,如果大家日常对PPT的质量要求较高,还是用复杂提示词保险一些。

可以在提示词中尽量把每几页需要生成哪些内容、画面风格、结构框架、页数这些维度详细去写。

简单提示词更适合对PPT没有太高要求的友友,用来应急也很合适,诶,感觉非常适合家长用来处理孩子的一些家庭作业!!!

文本渲染能力

除了语义理解能力,在做PPT时,我们还特别关注一个很现实的维度——字体会不会“变形”。

毕竟这是AI在做视觉生成,只要涉及图片渲染,文字就可能出现变形、结构错位、比例失衡等问题。

尤其是中文内容,字符复杂度高,对模型的细节控制能力要求更严!!!(敲黑板

咱们这次直接上强度,让AI生成一页符号密集、中英文混排、公式穿插的PPT内容,以下为提示词:

大家觉得——这AI的文本生成效果咋样?(欢迎友友们评论区留言~

先说说优点,首先是文本没有出现变形的问题,像≥、≠、↑、↓、→、² 这种符号都没有变形,中文也没有糊字。

此外,数据+公式+逻辑表达都在,演进路径、数据、核心变化、场景、流程、公式、总结要素也都在,格式也没太大问题。

but,还是经不住细看,比如这个比例的“例”字,和投入的“入”字,拐弯处的笔画收口有点毛边,而且是很明显的:

咱再把难度度再往上提一档,看看AI在面对“超高笔画密度”汉字时的文本渲染稳定性表现如何,以下为提示词:

AI:属实是有点难为我了啊!那就别怪我——大翻车了!(doge

是的,这次确实有点翻车了,龘、麤、叒、齉四个字,没有一个生成对了的,AI直接自己DIY了……

这个故事告诉我们,简单的字儿可以交给AI处理,涉及到如此地狱级复杂字体,大家伙还是老老实实自己在文档里敲字儿吧。

排版设计能力测一测

一个超哇塞的PPT,光有好的内容还不够,它还得——美!观!

要知道我们平时做PPT,挑模板这一步就能让人纠结半天,颜色要高级,排版要有层次,风格还得贴合主题,稍微不搭就显得很违和……

于是乎,我们接下来就重点考察考察千问PPT的审美到不到位,排版稳不稳。

这次咱直接测牛马党高频主题——

业务复盘与增长策略报告,数据多、逻辑重、信息密度高,最考验排版和层级:

从下面的生成效果看,在可视化形式上,折线图、柱状图、环形图、流程图都能准确呈现,图表类型与内容匹配度也比较高,没有出现图不对题的情况。

配色上,延续蓝灰主调,辅以橙色和绿色强调,整体风格统一度不错,尤其前三页色彩控制比较克制。

整体上偏成熟企业汇报风格,还是比较匹配主题的~

整体风格和排版没什么大问题,同理,这是不细看的前提下……因为还是一些小瑕疵的。(哭…

比如第一张趋势页的折线图区域还是略显拥挤,文字甚至已经超出了图表边界,出现了空间规划不足的问题:

以及第四张的流程图,“Q2目标”没居中,战略与经营部和产品与运营部的部门名称写成一行会更合适,现在的断行方式让卡片的重心略微失衡:

另外,大标题的对齐方式没有完全统一,有的居中,有的偏左。

单页看不明显,多页连看时就会造成视觉节奏不一致,也容易让人一瞬间分不清一级标题和二级标题的层级关系:

咋说呢,感觉像精细对齐、留白控制、文本边界这些细节,还是需要人工微调才能真正达到打磨过的水准,排版这种事还是不能完全交给AI…

最后的最后,我本来想尝试一下PPT的局部编辑能力,在表格基础上又加了新的需求,结果发现好像没这能力…

是的,AI不能根据第二次提示词进行局部修改,如果不合适的话,是要重新抽卡生成的……

这波测下来,最大的感受就是:

PPT毕竟是排版+文字+图形的综合活儿,AI在输出这类内容形式时,在字体边缘、图表细节、转角处理这些偏图形的维度上,偶尔还是会有些小瑕疵。

不过回到Qwen的强项——“语义遵循”和“图像生成”这块儿,效果是真能打。

页与页之间逻辑顺序在线,内容承接也比较自然,图片生的更不用说了,非常能体现Qwen模型强大的技术优势…

像日常课堂展示、内部小组汇报、孩子做家庭作业这种场景下使用,还是很推荐的。(最主要的是不花钱…

感兴趣的朋友可以上手试试。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10