肥宅钓鱼网
当前位置: 首页 钓鱼百科

科大语音引擎(辅助车载人工智能发展)

时间:2023-06-28 作者: 小编 阅读量: 2 栏目名: 钓鱼百科

在车载场景下,由于其不同于家居、医疗、客服等场景,该环境中的噪音更具多样性、不稳定性等特点,且车载场景涉及人身安全因素,对语音识别等效果要求较高。因而在优化语音识别等语音处理效果时,需要大量含噪声及不含噪声的测试语音音频数据作为支撑。如上图,为该专利中发明的车内含噪语音数据生成方法的流程示意图,这些含噪语音数据可以帮助开发人员实现更加优秀的用户语音识别算法及模块。

【嘉勤点评】科大讯飞发明的车内含噪语音数据生成方案,只需结合成熟的语音合成技术就可以实现人声素材资源的拓展,无需如现有技术重新反复进行实地录制数据,实现了对预先创建的语音素材资源的复用。解决了当前实车实景人工录制方式费时、费力、高成本等弊端,并有效提升了车用交互语音数据样本的制作效率。

集微网消息,随着人工智能的兴起,车载、教育、医疗都渗透了人工智能技术。其中,智能语音作为人机交互的重要手段被广泛应用于各个领域。

在车载场景下,由于其不同于家居、医疗、客服等场景,该环境中的噪音更具多样性、不稳定性等特点,且车载场景涉及人身安全因素,对语音识别等效果要求较高。因而在优化语音识别等语音处理效果时,需要大量含噪声及不含噪声的测试语音音频数据作为支撑。

其中,车内含噪语音数据集的构造往往需要实车在不同场地、环境条件下进行反复、多次实地采录。这种条件的制作要求相对较高,也导致整体成本也较高。此外,目前现有的车内含噪语音数据的制作方式通常只适用于单次目标效果的评估,也就是说经过反复多次在某一个场景中采集车内含噪语音数据完毕后,该数据集很难在更多的场景中重复使用。

因此,如果期望采录的车内含噪语音数据能够覆盖全场景,则必然要耗费大量的时间和人力从海量车内含噪语音数据中进行甄别、挑选、归类等繁琐工作。为了达到具有上述优良效果的语音数据集,科大讯飞在2021年6月22日申请了一项名为“车内含噪语音数据生成方法、装置以及设备”的发明专利(申请号:202110694011.4),申请人为科大讯飞股份有限公司。

根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。

如上图,为该专利中发明的车内含噪语音数据生成方法的流程示意图,这些含噪语音数据可以帮助开发人员实现更加优秀的用户语音识别算法及模块。首先,开发人员在系统中预先内置创建好的语音素材库,该素材库主要包含两类音频数据,分别为:纯人声音频数据和实车纯噪音音频数据。这是由于车内交互的含噪语音数据主要是由主说话人声源、环境噪声、干扰源构成。

主说话人声源就是指语音处理的对象,主要用于识别、唤醒、意图分析、指令操控等操作环节。而环境噪声主要是指行驶时的风噪及胎噪、车外噪音、空调噪、车载播放器输出声音以及其他杂音等。

其次,接收并解析用户输入的数据需求。例如,主说话人声源为男性、中文普通话以及50db,假设主说话人声源能量与车噪能量比例5:3。基于这样具体且明确的数据需求,可以直接执行后续步骤。

最后,根据解析后的数据需求,从语音素材库中分别匹配出与用户需求对应的纯人声音频数据以及实车纯噪音音频数据。并将匹配到的纯人声音频数据以及实车纯噪音音频数据进行混音处理,生成车内含噪语音数据。

如上图,为该专利中发明的语音数据扩方法的流程示意图,首先,从匹配出的纯人声音频数据中提取当前人声的语音基元。再利用语音基元以及预设的若干个车用交互文本,合成出批量的纯人声音频数据。最后,将合成的纯人声音频数据逐一与匹配出的实车纯噪音音频数据进行混音处理,得到批量的车内含噪语音数据。

因此,可以发现,该专利主要的目的在于预先采集纯实景车噪和纯人声声源以构造出车用语音素材库。该车用语音素材库中的音频资源用于与用户所提需求结合,分别得到符合用户期望的车内含噪语音数据的纯人声声源以及纯实景车噪。然后将匹配出的纯人声声源以及纯实景车噪进行通道融合,生成用户所需的目标车内含噪语音数据。

最后,如上图,为这种含噪语音数据生成系统的硬件装置模块,该系统中主要包括有:语音素材库创建模块1、数据需求获取模块2、需求匹配模块3以及目标数据生成模块4。

语音素材库创建模块可以预先创建语音素材库;数据需求获取模块用于接收并解析用户输入的数据需求;需求匹配模块用于根据解析后的数据需求,从语音素材库中分别匹配出与用户需求对应的纯人声音频数据以及实车纯噪音音频数据;最后,目标数据生成模块用于将匹配到的纯人和实车纯噪音音频数据进行混音处理,生成车内含噪语音数据。

以上就是科大讯飞发明的车内含噪语音数据生成方案,该方案只需结合成熟的语音合成技术就可以实现人声素材资源的拓展,无需如现有技术重新反复进行实地录制数据,实现了对预先创建的语音素材资源的复用。解决了当前实车实景人工录制方式费时、费力、高成本等弊端,并有效提升了车用交互语音数据样本的制作效率。

    推荐阅读
  • 秋季种植菠菜如何提高产量,菠菜种植方法技巧

    大多数菠菜品种适合种植。菠菜主根生长较深,需提前翻耕,翻耕深度约20cm。播种在播种前,可以适当地促进菠菜种子,这样可以节省出苗时间。菠菜种子用清水浸泡约12小时,去掉种子上的粘液,然后放在湿布上发芽。菠菜种子可直接播种,每亩种子用量约5公斤。菠菜生长进入中后期后,可根据菠菜的生长情况,施用1~2次有效氮肥,硫酸铵可配水供应每亩15左右。菠菜生长较快,可在种植后30至50天收获。

  • 累计调减生猪过半

    近日上午,德清县莫干山镇南路村的石蛙养殖大户蒋月明在签订养殖场关闭协议书时对村干部保证道。当天,在莫干山镇南路村村委,该镇相关工作人员与镇上的四家养殖场场主聚拢在一起,就保护水源,关闭养殖场进举动员并集中签约。上月中旬,莫干山镇针对镇上最后一批成规模的养殖场进举动员拆除,已关闭拆除一家羊棚,剩余的4家也将在随后2个月所有尽成关闭拆除。

  • 芜湖普通话成绩查询 芜湖普通话成绩查询官网

    若在查分平台未查到分数,则说明成绩尚未出来,可稍等几天再查询。普通话证书领取:领证事宜可在国家普通话水平测试在线系统“帮助中心--测试站公告”查询或直接向测试站联系。》〉芜湖市普通话测试站

  • 什么酱油好吃(酱油的种类)

    一般来说,氨基酸态氮的含量越高,说明酱油的味道越鲜美,所以等级也就越高我国最高等级的酱油为特级酱油,很多的生抽上面都有标注特级酱油,其次是一级酱油,然后是二级酱油,三级酱油4个档次如果说到什么酱油比较好吃,那肯定是级别越高的酱油越好吃,也就是我们经常吃的特级酱油,下面我们就来聊聊关于什么酱油好吃?什么酱油好吃一般来说,氨基酸态氮的含量越高,说明酱油的味道越鲜美,所以等级也就越高。

  • 信阳市罗山县公安局各户籍窗口联系电话

    信阳罗山县公安局各户籍窗口联系电话:罗山县公安局各户籍窗口联系电话单位联系电话县局户政大厅1393970512513937698866宝城派出所15839768129丽水派出所13837620001龙山派出所17839771095楠杆派出所13503763011竹竿派出所18837656610莽张派出所15939730309庙仙派出所13939701376周党派出所15225387789东铺派出所

  • 你在不开心的时候都会干什么(或许你过得不开心)

    做人风格表里如一,统一性强,目标明确。考虑全局观,注意避免冲动和急躁。个人定位很高,但缺乏创新性,不标新立异,喜欢在范围内按部就班。为人交友方面会大大咧咧,豪爽。更多表现在情绪不释放,应加强与父亲沟通。注意自己不要过于理想化,关注自己的情绪和本能需求,笔迹和绘画都显示理想化指标。通过无意识投射分析发现更深层的自己,认领自己的命运,主动,积极去接纳、创造、改变。

  • 祝福母亲节日快乐句子(盘点祝福母亲节日快乐句子)

    祝福母亲节日快乐句子?祝福母亲节日快乐句子亲爱的妈妈:您曾用您坚实的臂弯为我撑起一片蓝天;而今,我也要用我日益丰满的羽翼为您遮挡风雨。纵然想念不相见,对母亲始终有亏欠。我没有康乃馨,也没有华丽的珍珠。只有一颗心在为您祝福:愿您在母亲节平安幸福!妈妈,母亲节快乐!母亲节将临,我也没啥好送的,送您五万万吧:万万要开心,万万要舒心,万万要健康,万万要长寿,还有,万万不要担心我。

  • 休息室用英语怎么写(说到居家办公这个概念大家知道对应的英文表达是什么吗)

    而我们说的“在家远程办公”,是指原本应该在公司上班,但因一些原因,将上班地点从公司改为在家。这里的“在家办公”翻译为workfromhome更为合适。除了上面给大家介绍的固定搭配以外,在英语中关于“远程办公”还有个专门的表达叫telecommuting等同于teleworking。②Fortherestoftheweek,Iwillbetelecommuting.本周其他的时间我要远程办公。看起来似乎比workfromhome这个表达更加简洁、地道一些,但这几种表达都可以互换使用。

  • 霜降牛肉营养价值有多高(霜降吃牛肉的寓意)

    霜降牛肉的营养价值:1、牛肉含有丰富的蛋白质,氨基酸组成比猪肉更接近人体需要,能提高机体抗病能力,对生长发育及手术后、病后调养的人在补充失血、修复组织等方面物别适宜。寒冬食牛肉,有暖胃作用,为寒冬补益佳品。/2、中医认为,牛肉有补中益气、滋养脾胃、强健筋骨、化痰息风、止渴止涎的功效。

  • 琥珀的形成经历了哪四个阶段(琥珀的形成经历的过程)

    以下内容希望对你有帮助!琥珀的形成经历了哪四个阶段琥珀是中生代白垩纪至新生代第三纪松柏科植物的树脂,经地质作用而形成的有机混合物。琥珀的形成一般有四个阶段,第一阶段是树脂从柏松树上分泌出来,第二阶段是树脂被深埋,第三阶段发生了石化作用,树脂的成分、结构和特征都发生了明显的变化;第四阶段是石化树脂被冲刷、搬运、沉积和发生成岩作用从而形成了琥珀。