刚刚,豆包“成精”了!一夜告别机械感,上亿人手机全量上线

新智元
Apr 09

编辑:犀牛 桃子

【新智元导读】AI交互的“机械感”消失了!今天,豆包甩出原生全双工语音大模型Seeduplex,不仅能边听边说,甚至能听懂你在思考时的“卡壳”,就算环境再吵也不怕,抗干扰能力直接拉满。

终于等来这一天!AI语音交互,终于像个人了。

今天,字节跳动Seed团队悄然出手——

原生全双工语音大模型Seeduplex正式发布,并已在豆包App全量上线。

注意,是全量上线。不是内测,不是灰度,不是“敬请期待”。

豆包的语音交互体验一直是独一档,和老罗辩论也不在话下。

但是从今天起,上亿豆包用户打开App的那一刻,就能直接体验到一种前所未有的感觉——

AI不再是那个等你说完一句、按一下、再说下一句的乖学生,而是一个会边听边说、会等你思考、会被你打断、还能听懂你咖啡馆里在聊什么的“对话搭子”。

这是一件被业内低估了的大事。

它意味着:全双工语音技术,第一次真正走出了实验室,在业界率先实现了规模化落地

我们第一时间冲上去做了几轮实测。

说实话,体验下来只有一个感受:那种和AI说话时如鲠在喉的“机械感”,终于消失了。

那个总是“抢话”的 AI

终于像个真人了

通常来说,人与人的交互,存在着大量的信息交叠、打断、迟疑、环境噪音等。

传统的“半双工”语音AI,在面对这些复杂场景时,往往会力不从心——

要么在你刚停顿思考时强行抢话,要么在嘈杂环境中胡言乱语。

这一次,在保持极速响应的同时,Seeduplex啃下了“精准抗干扰”与“动态判停”的两块硬骨头。

想要上手非常简单,把豆包App升级到最新版本,进入后点击右上角打电话,即可开启“语音通话”的丝滑体验了。

场景一:咖啡厅里聊行程,精准抗干扰

假设进入一家人声鼎沸的咖啡馆里,和豆包讨论周末去哪儿玩。

背景里,邻桌大叔在大声讲电话,服务员的报单声此起彼伏,咖啡机在嗡嗡作响......

聊到一半,我顺手转向前台:“你好,我要一杯拿铁,不加糖”。

在这样吵闹的环境中,放在过去任何一个语音助手身上,几乎都是“车祸现场”——

要么把对别人说的话当成新指令一本正经地执行,要么直接卡壳中断,得重新喊一遍唤醒词才能接着聊。

令人惊喜的是,豆包没有抢话,并在嘈杂环境下保持极强的抗干扰力。

它只是安静地停了一下,等你把咖啡点完,然后顺着刚才的话题继续往下接,仿佛中间那段嘈杂从未发生过。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10