钉钉联手通义实验室发布Fun-ASR语音识别大模型,支持企业专属模型定制训练

新浪科技
Aug 22

  新浪科技讯 8月22日下午消息,钉钉、通义实验室语音团队宣布,联手推出新一代语音识别大模型Fun-ASR,能听懂家装、畜牧等十大行业黑话,并支持企业专属模型定制训练。目前,Fun-ASR已被集成进钉钉的多个功能模块,包括会议字幕与同传、智能纪要、语音助手等。

  技术层面看,Fun-ASR语音识别大模型的核心亮点在于三方面:其一,全面增强了对行业专有词汇的识别能力。该模型经过上亿小时音频数据的训练,结合钉钉多行业客户的真实场景共创,能够准确理解互联网、科技、家装、畜牧、汽车等十多个领域的专业术语。

  其二,结合钉钉带来了更强的上下文感知和理解能力。Fun-ASR可结合企业在钉钉内的已有信息如通讯录、日程、知识库等,进行推理优化,有效缓解大模型造成的幻觉,提供更可靠的转写结果。该能力需经企业授权后方可生效。

  其三,针对有高阶需求的企业,支持定制化语音识别模型训练。基于高效的端到端训练架构,该模型可利用企业提供的真实场景语音数据进一步做算法优化,以提升如品牌名、项目代号、产品名、人名等专属词汇的识别准确率。

  对于此次合作,通义实验室语音团队负责人李先刚表示:“我们很高兴能够与钉钉携手,共同推动语音识别技术在企业场景中的创新和应用。未来,我们将持续扩大Fun-ASR的数据和模型规模,不断提升大模型语音智能解决方案的可复制能力,为企业客户带来更高效、智能的产品体验。”

  钉钉CTO朱鸿也表示,“钉钉和通义团队仅用三个月的紧密协作,就实现了Fun-ASR模型的成功落地,并赢得了头部客户的高度认可。这是我们迈向行业领先的一次关键突破,也将为更多钉钉客户打造专业定制大模型提供可参考的范例。”

海量资讯、精准解读,尽在新浪财经APP

责任编辑:郭栩彤

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10