刚刚,豆包“成精”了!一夜告别机械感,上亿人手机全量上线

新智元
04/09

编辑:犀牛 桃子

【新智元导读】AI交互的“机械感”消失了!今天,豆包甩出原生全双工语音大模型Seeduplex,不仅能边听边说,甚至能听懂你在思考时的“卡壳”,就算环境再吵也不怕,抗干扰能力直接拉满。

终于等来这一天!AI语音交互,终于像个人了。

今天,字节跳动Seed团队悄然出手——

原生全双工语音大模型Seeduplex正式发布,并已在豆包App全量上线。

注意,是全量上线。不是内测,不是灰度,不是“敬请期待”。

豆包的语音交互体验一直是独一档,和老罗辩论也不在话下。

但是从今天起,上亿豆包用户打开App的那一刻,就能直接体验到一种前所未有的感觉——

AI不再是那个等你说完一句、按一下、再说下一句的乖学生,而是一个会边听边说、会等你思考、会被你打断、还能听懂你咖啡馆里在聊什么的“对话搭子”。

这是一件被业内低估了的大事。

它意味着:全双工语音技术,第一次真正走出了实验室,在业界率先实现了规模化落地

我们第一时间冲上去做了几轮实测。

说实话,体验下来只有一个感受:那种和AI说话时如鲠在喉的“机械感”,终于消失了。

那个总是“抢话”的 AI

终于像个真人了

通常来说,人与人的交互,存在着大量的信息交叠、打断、迟疑、环境噪音等。

传统的“半双工”语音AI,在面对这些复杂场景时,往往会力不从心——

要么在你刚停顿思考时强行抢话,要么在嘈杂环境中胡言乱语。

这一次,在保持极速响应的同时,Seeduplex啃下了“精准抗干扰”与“动态判停”的两块硬骨头。

想要上手非常简单,把豆包App升级到最新版本,进入后点击右上角打电话,即可开启“语音通话”的丝滑体验了。

场景一:咖啡厅里聊行程,精准抗干扰

假设进入一家人声鼎沸的咖啡馆里,和豆包讨论周末去哪儿玩。

背景里,邻桌大叔在大声讲电话,服务员的报单声此起彼伏,咖啡机在嗡嗡作响......

聊到一半,我顺手转向前台:“你好,我要一杯拿铁,不加糖”。

在这样吵闹的环境中,放在过去任何一个语音助手身上,几乎都是“车祸现场”——

要么把对别人说的话当成新指令一本正经地执行,要么直接卡壳中断,得重新喊一遍唤醒词才能接着聊。

令人惊喜的是,豆包没有抢话,并在嘈杂环境下保持极强的抗干扰力。

它只是安静地停了一下,等你把咖啡点完,然后顺着刚才的话题继续往下接,仿佛中间那段嘈杂从未发生过。

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10