肥宅钓鱼网
当前位置: 首页 钓鱼百科

科大语音引擎(辅助车载人工智能发展)

时间:2023-06-28 作者: 小编 阅读量: 2 栏目名: 钓鱼百科

在车载场景下,由于其不同于家居、医疗、客服等场景,该环境中的噪音更具多样性、不稳定性等特点,且车载场景涉及人身安全因素,对语音识别等效果要求较高。因而在优化语音识别等语音处理效果时,需要大量含噪声及不含噪声的测试语音音频数据作为支撑。如上图,为该专利中发明的车内含噪语音数据生成方法的流程示意图,这些含噪语音数据可以帮助开发人员实现更加优秀的用户语音识别算法及模块。

【嘉勤点评】科大讯飞发明的车内含噪语音数据生成方案,只需结合成熟的语音合成技术就可以实现人声素材资源的拓展,无需如现有技术重新反复进行实地录制数据,实现了对预先创建的语音素材资源的复用。解决了当前实车实景人工录制方式费时、费力、高成本等弊端,并有效提升了车用交互语音数据样本的制作效率。

集微网消息,随着人工智能的兴起,车载、教育、医疗都渗透了人工智能技术。其中,智能语音作为人机交互的重要手段被广泛应用于各个领域。

在车载场景下,由于其不同于家居、医疗、客服等场景,该环境中的噪音更具多样性、不稳定性等特点,且车载场景涉及人身安全因素,对语音识别等效果要求较高。因而在优化语音识别等语音处理效果时,需要大量含噪声及不含噪声的测试语音音频数据作为支撑。

其中,车内含噪语音数据集的构造往往需要实车在不同场地、环境条件下进行反复、多次实地采录。这种条件的制作要求相对较高,也导致整体成本也较高。此外,目前现有的车内含噪语音数据的制作方式通常只适用于单次目标效果的评估,也就是说经过反复多次在某一个场景中采集车内含噪语音数据完毕后,该数据集很难在更多的场景中重复使用。

因此,如果期望采录的车内含噪语音数据能够覆盖全场景,则必然要耗费大量的时间和人力从海量车内含噪语音数据中进行甄别、挑选、归类等繁琐工作。为了达到具有上述优良效果的语音数据集,科大讯飞在2021年6月22日申请了一项名为“车内含噪语音数据生成方法、装置以及设备”的发明专利(申请号:202110694011.4),申请人为科大讯飞股份有限公司。

根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。

如上图,为该专利中发明的车内含噪语音数据生成方法的流程示意图,这些含噪语音数据可以帮助开发人员实现更加优秀的用户语音识别算法及模块。首先,开发人员在系统中预先内置创建好的语音素材库,该素材库主要包含两类音频数据,分别为:纯人声音频数据和实车纯噪音音频数据。这是由于车内交互的含噪语音数据主要是由主说话人声源、环境噪声、干扰源构成。

主说话人声源就是指语音处理的对象,主要用于识别、唤醒、意图分析、指令操控等操作环节。而环境噪声主要是指行驶时的风噪及胎噪、车外噪音、空调噪、车载播放器输出声音以及其他杂音等。

其次,接收并解析用户输入的数据需求。例如,主说话人声源为男性、中文普通话以及50db,假设主说话人声源能量与车噪能量比例5:3。基于这样具体且明确的数据需求,可以直接执行后续步骤。

最后,根据解析后的数据需求,从语音素材库中分别匹配出与用户需求对应的纯人声音频数据以及实车纯噪音音频数据。并将匹配到的纯人声音频数据以及实车纯噪音音频数据进行混音处理,生成车内含噪语音数据。

如上图,为该专利中发明的语音数据扩方法的流程示意图,首先,从匹配出的纯人声音频数据中提取当前人声的语音基元。再利用语音基元以及预设的若干个车用交互文本,合成出批量的纯人声音频数据。最后,将合成的纯人声音频数据逐一与匹配出的实车纯噪音音频数据进行混音处理,得到批量的车内含噪语音数据。

因此,可以发现,该专利主要的目的在于预先采集纯实景车噪和纯人声声源以构造出车用语音素材库。该车用语音素材库中的音频资源用于与用户所提需求结合,分别得到符合用户期望的车内含噪语音数据的纯人声声源以及纯实景车噪。然后将匹配出的纯人声声源以及纯实景车噪进行通道融合,生成用户所需的目标车内含噪语音数据。

最后,如上图,为这种含噪语音数据生成系统的硬件装置模块,该系统中主要包括有:语音素材库创建模块1、数据需求获取模块2、需求匹配模块3以及目标数据生成模块4。

语音素材库创建模块可以预先创建语音素材库;数据需求获取模块用于接收并解析用户输入的数据需求;需求匹配模块用于根据解析后的数据需求,从语音素材库中分别匹配出与用户需求对应的纯人声音频数据以及实车纯噪音音频数据;最后,目标数据生成模块用于将匹配到的纯人和实车纯噪音音频数据进行混音处理,生成车内含噪语音数据。

以上就是科大讯飞发明的车内含噪语音数据生成方案,该方案只需结合成熟的语音合成技术就可以实现人声素材资源的拓展,无需如现有技术重新反复进行实地录制数据,实现了对预先创建的语音素材资源的复用。解决了当前实车实景人工录制方式费时、费力、高成本等弊端,并有效提升了车用交互语音数据样本的制作效率。

    推荐阅读
  • 洋槐花的吃法大全(洋槐花的几种吃法)

    洋槐花的吃法大全冰糖槐花,取槐花50克,山药100克,冰糖、橙汁、蜂蜜各适量。将鲜槐花洗净,将山药洗净去皮,放在冰箱里冷冻5分钟,然后将山药切条焯水,冰糖中加入橙汁和蜂蜜,融化好的冰糖汁浇在槐花、山药中,拌匀即可。槐花山珍汤,槐花20克,各种食用菌类。粉蒸槐花,槐花350克,小米面适量、鸡蛋2个。鲜虾煎槐花,槐花30克,面粉适量,鸡蛋2个,鲜虾仁200克。

  • 企业微信如何解绑微信号(企业微信可以更换绑定的微信号吗)

    2)新旧微信需要处于正常状态的微信。).如有异常,更改绑定会提示微信账号异常,请在微信解除异常后操作更改绑定。建议在收到未收到的红包后操作绑定微信。3)目前微信关注的微信插件将取消关注,清空历史信息,微信成功更换后,新微信将自动重新关注微信插件。

  • 水镜先生说诸葛亮出山(水镜先生卧龙虽得其主)

    在第三十五回,先是在水镜先生口中说出“卧龙、凤雏,二人得一,可安天下”,而那时水镜先生尚不愿透露谁是卧龙,使得刘备误以为徐庶是卧龙。到了第三十六回,冒称单福的徐庶被曹操以老母亲为胁迫,不得已向刘备坦白,临走前告诉了刘备真相:卧龙即躬耕南阳卧龙岗的诸葛孔明。水镜先生听说徐庶投奔了刘备,特意前来拜望。这一顿猛吹迷住了刘备的心,他迫切地想要得到诸葛亮的辅佐。水镜先生一看目的达到了,也就离开了。

  • 快手上的快币怎么提现 快手上的快币怎么提现到支付宝上

    2019年9月11日,快手社区官方账号“快手小管家”发布封禁恶意炒作账号的处罚公告,对一批涉嫌恶意炒作、低俗八卦、刻意炫富、严重扰乱社区秩序、有违社会公序良俗的账号进行封禁处理。在快手上,用户可以用照片和短视频记录自己的生活点滴,也可以通过直播与粉丝实时互动。

  • 浮尘若梦是什么意思(什么是浮尘若梦)

    浮尘若梦的原出处是出自于李白《春夜宴从弟桃花园序》一文中的“夫天地者,万物之逆旅;光阴者,百代之过客而浮生若梦,为欢几何?”,我来为大家科普一下关于浮尘若梦是什么意思?下面希望有你要的答案,我们一起来看看吧!这句诗文意思是说天地是万物的客舍,时间是古往今来的过客,死生之差异,就好像梦与醒之不同,风云变换,不可究诘;也是对人生无常的时叹。

  • 奶茶能隔夜喝吗(奶茶能隔夜喝吗,封口过的)

    奶茶能隔夜喝吗保存得当的话,可以隔夜喝。奶茶能放微波炉加热吗可以。奶茶可以提神醒脑吗有一定的功效。奶茶喝了长胖吗适当的喝一些奶茶不会长胖;过多的饮用奶茶有长胖的风险。小贴士如果本身体重基数较大的话,建议慎喝奶茶,以免过多的摄取糖分等元素,不利于体重。

  • 2022武汉社保新系统热点问题12个 2021年武汉社保新政策出台了

    目前,参保单位和灵活就业人员可先行办理不涉及2022年度社保缴费基数的各项业务。单位办理缓缴后,每月仍应按时申报缴纳职工个人部分的社保费。灵活就业人员因系统停机未及时缴纳6月份社保费的,可在武汉市上线国省统筹信息系统后及时进行补缴,补缴后不影响今年第二季度灵活就业人员社会保险补贴申领。

  • 送男友生日蛋糕自制(马鞍山男大学生自制生日蛋糕送室友)

    送男友生日蛋糕自制新安晚报安徽网大皖新闻讯这两天,有一段短视频火了,因疫情封校,马鞍山皖江工学院的几名男生就地取材,自制蛋糕为室友过生日。网友们盛赞他们为“神仙友谊”。小赵说,全国各地的网友都在祝室友生日快乐,还为他们的友情点赞。小赵表示,目前室友都在准备考研或者考公,封校期间除了上课,很多时间花在自习室看书,常常回到宿舍都已经很晚了。

  • 抖音很火的睡前晚安的句子(抖音非常火的晚安优秀句子)

    抖音很火的睡前晚安的句子如果你不愿意改变,那也别指望你的生活会有所变化。不要质疑你的付出,这些都是一种累积一种沉淀,它们会默默铺路,只为让你成为更优秀的人。时间会告诉我们,简单的喜欢最长远,平凡中的陪伴最心安,懂你的人最温暖。人的幸运在于,做错事总有人鞭策于你,时时告诫,不浪费每一刻时光,不做令自己后悔的事。要知道我们交的不是学费,而是青春。

  • 番茄转色注意什么,番茄养殖应该注意什么

    在番茄变色期间,其果皮会逐渐变绿成熟。如果现阶段管理不当,将导致番茄面皮的形成。而要想使番茄色泽均匀,提高商品质量,就要注意管理中的几个要点。在番茄变色期,控温要着眼全局,保持与往常一样。避免叶片过度稀疏番茄在变色期需要充足的光照,果实周围的叶子无疑影响其透气性,因此应及时清除。因此,在番茄变色期,应注意叶片的合理间伐。以上是番茄颜色转换注意事项的介绍,希望对您有所帮助。