腾讯云发布专属语音识别模型,加速在金融、音视频行业应用-风君雪科技博客

  4 月 29 日,腾讯云正式发布金融、音视频等多个领域专属语音识别模型。最新发布的模型不仅识别准确率得到大幅提升,同时也增加了对粤语、韩语的支持,后面会陆续开放对上海话等方言以及日语、泰语、印尼语等国外语言的支持。

  正式发布金融行业专属模型,字准率业界领先

  据了解,语音识别在金融行业应用场景广泛,但是实际场景下,很多用户都是使用方言在和外呼、客服机器人交流,加上金融领域有着大量的专有句式和词汇,市场上目前通用的语音识别模型存在识别不准的情况。

  基于这些的痛点,腾讯云 AI 团队与微信智聆联合打造了金融行业专属语音识别模型,这个模型的推出不仅能够有效解决上述难题,还在识别的准确率上得到大幅提升。目前该模型已经在金融领域的智能外呼、智能客服、电话录音质检等多个场景落地。经客户实测,字准率在业界处于领先水平。

  率先打造音视频专属语音识别模型,准确率提升 10%

  随着互联网直播浪潮的兴起,如何利用智能语音技术快速识别用户的音视频内容、进行精准推荐和不健康内容过滤,已经成为各大直播和内容分享平台在日益激烈的市场竞争中的核心竞争力。但由于音视频背景环境复杂且属于半远场,需要有大量数据积累才能实现准确识别。

  凭借自身在音视频领域数据的大量积累,腾讯云在业界率先推出了音视频领域专属语音识别模型,目前已在多家音视频领域直播平台和电商直播平台应用,经客户实测,识别准确率提升近 10%。

  语种丰富度进一步提升,腾讯云语音识别加速落地

  为满足不同客户群体需求,腾讯云语音识别今年在语种丰富度上持续发力,联合微信智聆、腾讯国际业务语音技术实验室、腾讯民汉翻译等多个人工智能实验室,在原有常见语种基础上,开放了韩语、粤语的识别能力,后面会陆续开放对上海话等方言以及日语、泰语、印尼语等国外语言的语音识别能力。经过长期的打磨训练和效果调优,目前腾讯云语音识别各语种已广泛应用于会议记录转写、视频字幕、电话录音质检等业务场景。

  实际上,腾讯云凭借多年在智能语音领域的耕耘,已经收获众多权威机构的认可。在 Gartner 今年首次正式发布的《Magic Quadrant for Cloud AI Developer Services》研究报告中,腾讯云成为中国唯一入选 Gartner 云 AI 开发者服务魔力象限的云厂商。

  腾讯云 AI 语音产品负责人周超表示:“腾讯云 AI 语音团队未来仍将继续打磨技术,提供业界最具性价比的智能语音产品,推动智能语音在产业互联网的广泛落地。用更前沿的技术、更极致的产品体验,帮助合作伙伴和客户打造高效的专属解决方案,助力各行各业的数字化和智能化转型。”