肥宅钓鱼网
当前位置: 首页 钓鱼百科

斯坦福实验研究(斯坦福大学新研究)

时间:2023-06-17 作者: 小编 阅读量: 3 栏目名: 钓鱼百科

波动与RNN的联系这一部分将介绍RNN的操作与波动之间的联系。该任务以传统RNN作为性能基准,其分类准确率与波动方程差不多,但是它需要大量自由参数。此外,与传统RNN不同的是,波动方程遵循能量守恒约束,防止隐藏状态和输出信号的范数无限增长。相比之下,定义标准RNN更新关系的无约束密集矩阵会导致梯度消失和爆炸,这是传统RNN训练过程中的主要挑战。该研究证明波动方程在概念上等价于RNN。

选自Reddit

作者:Ian Williamson机器之心编译
参与:王子嘉、魔王

斯坦福大学的一项研究发现:物理学中波动与 RNN 中的计算存在对应关系。



论文地址:https://advances.sciencemag.org/content/5/12/eaay6946GitHub 地址:https://github.com/fancompute/wavetorch
最近,机器学习与物理和数值科学的一些领域碰撞出了不少火花。这让机器学习框架在物理模型优化问题中有了用武之地,同时机器学习领域也在物理概念的帮助下出现了很多令人兴奋的新模型(如神经 ODE 和哈密顿神经网络等)。
本文作者所在小组的研究重点是:物理本身就可以作为计算引擎。换句话说,作者们感兴趣的是那些可以作为硬件加速器(或是专门用于快速高效的机器学习计算的模拟处理器)的物理系统。
他们最近发表在《Science Advances》上的论文,证明了波的物理特性可被直接映射到循环神经网络的时序变化。利用这种联系,作者们通过 PyTorch 开发了一个数值模型,该模型证明我们可以训练一个声学/光学系统,并利用它从人类说话者录音中准确地识别出元音。本质上,作者们将元音元音波形引入物理模型,并允许优化器在域内的 1000 个点上添加和删除材料,这个操作实际上可以当做模型的权重。
因为这个机器学习模型实际上对应于一个物理系统,这也就意味着研究者可以把经过训练的材料分布「打印」到真实的物理设备中。其结果类似于 ASIC (Application Specific Integrated Circuit),但只能针对特定的 RNN 计算。这令人感到非常兴奋,因为这些结果表明可以在不消耗多余能量(除了脉冲本身携带的能量)的情况下,执行复杂的循环机器学习计算。
以下是对这篇研究核心思想的介绍。
波动与 RNN 的联系
这一部分将介绍 RNN 的操作与波动之间的联系。
RNN 一步步对输入序列的每一部分执行相同的操作,从而将输入序列转换成输出序列(图 1A)。之前步的信息被编码存储在 RNN 的隐藏状态中,隐藏状态在每一步都会更新。正是这些隐藏状态使得 RNN 记住过去的信息,同时学习数据中的时序结构和长距离依赖关系。在给定时间步 t 处,RNN 同时处理输入序列中的当前输入向量 x_t 以及前一步传来的隐藏状态向量 h_t-1,从而得到输出向量 y_t,并更新当下的隐藏状态 h_t。

图 1:标准 RNN 与基于波的物理系统之间的概念比较。
训练一个分辨元音的物理系统
这一部分将说明如何使用波动方程来训练元音分类器,其主要通过构建非均匀材料分布来实现。为了完成这个任务,该研究所用数据集包含 45 位男性和 48 位女性关于 10 个元音的 930 条原始录音。在模型训练过程中,该研究选取了关于这 3 个元音(ae、ei、iy)的 279 条录音作为训练集(图 2A)。

图 2:元音识别的设置和训练过程示意图。
对初始网络 5 次交叉验证训练的结果取均值后得到的训练集与测试集上的混淆矩阵参见图 3(A、B)。混淆矩阵中对角线上的值定义了正确预测元音的比例,非对角线上的值则是未能正确预测的比例。从结果可以看出,初始结构是无法完成识别任务的。
图 3 中的 C 和 D 展示了优化后训练集和测试集上的最终混淆矩阵。这些结果同样是对 5 次交叉验证运行的结果取均值得到的。训练后的混淆矩阵是对角占优的,也就是说现在这个结构可以执行元音识别任务了。

图 3:元音识别任务的训练结果。
图 3 中的 E 和 F 分别展示了交叉熵损失和预测准确率,横坐标是训练集和测试集上的训练 epoch 数。图中的实线表示平均值,阴影区域则是交叉验证训练运行的标准差。从中我们看到第一个 epoch 使损失下降了最多,而且对于准确率的提升也是最大的。从图 3F 中可以看出,这个系统在训练集上的平均准确率是 92.6 ±1.1%,而在测试集上的平均准确率是 86.3 ± 4.3%。
从图 3 的 C 和 D 中可以观察到系统在元音 ae 的识别上表现近乎完美,也能很好地将 iy 和 ei 分辨开来(不过准确率稍低),这种特征在测试集的未见样本上尤为明显。图 3 的 G 到 I 展示了:将每个元音类的代表性样本注入到训练结构中时的综合场强分布(integrated field intensity)∑_t u_t^2。
该研究用视觉化的方式证明了,产生目标结构的优化过程将大部分信号发送至正确的地方。该任务以传统 RNN 作为性能基准,其分类准确率与波动方程差不多,但是它需要大量自由参数。此外,我们观察到,训练线性波动方程所获得的分类准确率也是很有竞争力的,有关性能的更多细节会参见原论文。
讨论
该研究提出的这种基于波的 RNN 有很多优势,这些优势使得它在处理时序编码信息时可以得心应手。与传统 RNN 不同,波动方程在从一个时间步到另一个时间步的更新过程中,通过拉普拉斯算子(图 1E 中的稀疏矩阵)实现隐藏状态元素之间的最近邻耦合。最近邻耦合主要得益于,波动方程是信息以有限速度传播的双曲型偏微分方程。因此,模拟 RNN 的隐藏状态大小和存储容量直接取决于传播介质的大小。此外,与传统 RNN 不同的是,波动方程遵循能量守恒约束,防止隐藏状态和输出信号的范数无限增长。相比之下,定义标准 RNN 更新关系的无约束密集矩阵会导致梯度消失和爆炸,这是传统 RNN 训练过程中的主要挑战。
该研究证明波动方程在概念上等价于 RNN。这种概念上的联系为一类新的模拟硬件平台提供了思路,在这类平台中,演化时序在物理和数据集中都扮演着重要的角色。当我们专注于用标量波动方程描述的最普遍波动示例时,我们的结果可以很容易地扩展到其他类似于波的物理概念。这种利用物理执行计算的方法可能促进新型模拟机器学习设备新平台的研发,模拟设备有望比对应的数字设备更自然高效地执行计算。该方法的通用性进一步表明,许多物理系统可能是对动态信号(如光学、声学或地震学中的动态信号)执行类 RNN 计算的有力候选者。
参考链接:https://www.reddit.com/r/MachineLearning/comments/ej3bgf/r_acoustic_optical_and_other_types_of_waves_are/

    推荐阅读
  • 吐奶和溢奶的区别(吐奶vs溢奶傻傻分不清楚)

    当宝宝被过度喂养后,进奶量超过了胃部的极限,溢奶自然就发生了。宝宝之所以会溢奶,是因为肠胃发育不完全引起的,属于正常现象。一旦宝宝吃多了,奶水就会从“盖子”的缝隙中渗透过来,此时溢奶就发生了。妈妈可以通过更换小一号的奶嘴,降低乳汁流速来避免溢奶问题。

  • 即将被韩国翻拍的剧(连韩国都要翻拍)

    故事则围绕受到大毒枭死亡威胁的理财师马蒂展开。2018年4月,它超过了《怪奇物语》的播放量,网飞由此与导演阿莱克斯·皮纳签署了一份全球制作协议,开始了后续几季的拍摄。算起来这是网飞打造的首部德剧,主创团队全员德国选手。《巴比伦柏林》由知名德国导演汤姆·提克威指导并编剧,该剧制作异常精良,甚至让人觉得这不是一部电视剧。该剧聚焦希特勒上台之前,魏玛共和国末期的人间百态。一战幸存者们经受着创伤的折磨,战争不在

  • 策之不以其道的道是什么意思(策之不以其道的道什么意思)

    策之不以其道的道意思是:正确的方法整句意思:鞭策它,却不按照正确的方法出自唐代韩愈《马说》,下面我们就来聊聊关于策之不以其道的道是什么意思?接下来我们就一起去了解一下吧!出自唐代韩愈《马说》。水流通行的途径:河道。方向;方法;道理:志同道合。以其人之道,还治其人之身。得道多助,失道寡助。

  • 泡椒笋尖炒鸡肉(泡椒笋尖炒鸡肉做法)

    主料:鸡肉1块、笋尖适量、青红辣椒2个、植物油适量、生抽5克、姜5克、花椒粉1克;,下面我们就来聊聊关于泡椒笋尖炒鸡肉?青红辣椒洗净切块、姜切末,笋尖由于是腌制好的,可以切成条或者段,这样比较好入味。热锅凉油,油热7成下鸡肉条,中火翻炒均匀出水分出香味,加料酒翻炒均匀即可出锅待用。加少许的鸡精,大约翻炒1分钟左右,出锅即可了,鸡肉滑嫩可口,笋尖酸香适宜,口感极好,作为下饭菜或者下酒菜都是美味。

  • 全省理科分段统计表(这项指标南理独占鳌头)

    近日,江西省本科高校教育国际化水平排行榜发布,南昌理工学院在江西省本科高校具有国(境)外学位的教师人数占教师总人数百分比前10位中位列第一。据悉,2021年5月,江西省教育厅委托江西师范大学高等教育研究中心、江西省教育国际交流协会和江西省教育国际合作与教师发展中心联合成立课题组,对江西省2020年本科高校教育国际化水平进行评估。

  • 解读男性更年期综合征(男性更年期综合征)

    中老年男性血清总睾酮水平正常,但出现典型更年期症状,与血清中生物活性睾酮水平下降关系密切。②体能下降症状:肌肉体积和肌力下降,体力和耐力下降、疲乏无力等。警惕中老年男性出现上述一个或几个症状,要想到LOH可能,要根据典型临床症状和实验室检查予以诊断。十一酸睾酮针为长效制剂,需要深部肌肉注射。

  • vivo怎么修改实名认证(如何修改实名认证vivo)

    vivo不能修改实名认证,也无法删除实名认证。如果想绑定新的实名认证,可以另外创建一个新号进行操作。以vivoX23,系统版本:FuntouchOS10,为例:1、打开手机上的设置,点击进去。实名后不可以进行更改和解绑,所以实名前需谨慎操作。上述就是关于vivo怎么修改实名认证的内容介绍了,希望能对小伙伴们有所帮助。

  • etc办卡建行流程(联合电动购车免费办理建行速通卡)

    etc办卡建行流程对于普通借记卡持卡人想要办理一张ETC速通卡,通常需要到银行指定网点办理,或被要求加办一张用于关联绑定的信用卡。为了让客户享受更多的便捷,联合电动与建设银行合作,免费为我司购车的客户办理速通卡,还赠送价值400元的电子标签,同时可享受5%的通行费优惠。据了解,速通卡ETC专用通道不停车,自动记账,方便快捷。现已在2016年实现全国联网通行,畅行全国。

  • 抖音红人与他们的产地

    2018年7月,抖音正式宣布抖音与TikTok的月活跃用户超过5亿,成为继Facebook、Instagram和微信在内,第七个达成此项成就的全球社群软件。TikTok目前则未公布官方用户数据。而今年6月的月活跃用户排行中,抖音以2亿高居第二名,仅次于拥有2.3亿月活跃用户的“快手”。在短短一年内,TikTok的下载量便已超越各大社交媒体巨头。2018年8月,TikTok宣布正式与2017年11月收购的北美知名短片应用程序Musical.ly合并,国际版图又再一次地扩展。王宜蓁现在拥有将近3000个粉丝。

  • 幼儿园养成教育公开课(潜心养成教育构筑美好童年)

    九江新闻网讯 为了更好地开展园本教研活动,提升教师专业素养,近期,庐山市中心幼儿园全体教师参加了由小班年级组织开展的以“生活即教育,习惯伴成长”为主题的大教研活动,探讨处于幼儿园小班阶段孩子的养成教育问题,活动取得了良好的效果。本次教研活动由小班教研组长余少琦老师主持。教研内容很契合正处于幼儿园小班年龄段的孩子。我们坚信,只要我们潜心养成教育,庐山市中心幼儿园保教质量必将迈上新台阶!