肥宅钓鱼网
当前位置: 首页 钓鱼百科

斯坦福实验研究(斯坦福大学新研究)

时间:2023-06-17 作者: 小编 阅读量: 3 栏目名: 钓鱼百科

波动与RNN的联系这一部分将介绍RNN的操作与波动之间的联系。该任务以传统RNN作为性能基准,其分类准确率与波动方程差不多,但是它需要大量自由参数。此外,与传统RNN不同的是,波动方程遵循能量守恒约束,防止隐藏状态和输出信号的范数无限增长。相比之下,定义标准RNN更新关系的无约束密集矩阵会导致梯度消失和爆炸,这是传统RNN训练过程中的主要挑战。该研究证明波动方程在概念上等价于RNN。

选自Reddit

作者:Ian Williamson机器之心编译
参与:王子嘉、魔王

斯坦福大学的一项研究发现:物理学中波动与 RNN 中的计算存在对应关系。



论文地址:https://advances.sciencemag.org/content/5/12/eaay6946GitHub 地址:https://github.com/fancompute/wavetorch
最近,机器学习与物理和数值科学的一些领域碰撞出了不少火花。这让机器学习框架在物理模型优化问题中有了用武之地,同时机器学习领域也在物理概念的帮助下出现了很多令人兴奋的新模型(如神经 ODE 和哈密顿神经网络等)。
本文作者所在小组的研究重点是:物理本身就可以作为计算引擎。换句话说,作者们感兴趣的是那些可以作为硬件加速器(或是专门用于快速高效的机器学习计算的模拟处理器)的物理系统。
他们最近发表在《Science Advances》上的论文,证明了波的物理特性可被直接映射到循环神经网络的时序变化。利用这种联系,作者们通过 PyTorch 开发了一个数值模型,该模型证明我们可以训练一个声学/光学系统,并利用它从人类说话者录音中准确地识别出元音。本质上,作者们将元音元音波形引入物理模型,并允许优化器在域内的 1000 个点上添加和删除材料,这个操作实际上可以当做模型的权重。
因为这个机器学习模型实际上对应于一个物理系统,这也就意味着研究者可以把经过训练的材料分布「打印」到真实的物理设备中。其结果类似于 ASIC (Application Specific Integrated Circuit),但只能针对特定的 RNN 计算。这令人感到非常兴奋,因为这些结果表明可以在不消耗多余能量(除了脉冲本身携带的能量)的情况下,执行复杂的循环机器学习计算。
以下是对这篇研究核心思想的介绍。
波动与 RNN 的联系
这一部分将介绍 RNN 的操作与波动之间的联系。
RNN 一步步对输入序列的每一部分执行相同的操作,从而将输入序列转换成输出序列(图 1A)。之前步的信息被编码存储在 RNN 的隐藏状态中,隐藏状态在每一步都会更新。正是这些隐藏状态使得 RNN 记住过去的信息,同时学习数据中的时序结构和长距离依赖关系。在给定时间步 t 处,RNN 同时处理输入序列中的当前输入向量 x_t 以及前一步传来的隐藏状态向量 h_t-1,从而得到输出向量 y_t,并更新当下的隐藏状态 h_t。

图 1:标准 RNN 与基于波的物理系统之间的概念比较。
训练一个分辨元音的物理系统
这一部分将说明如何使用波动方程来训练元音分类器,其主要通过构建非均匀材料分布来实现。为了完成这个任务,该研究所用数据集包含 45 位男性和 48 位女性关于 10 个元音的 930 条原始录音。在模型训练过程中,该研究选取了关于这 3 个元音(ae、ei、iy)的 279 条录音作为训练集(图 2A)。

图 2:元音识别的设置和训练过程示意图。
对初始网络 5 次交叉验证训练的结果取均值后得到的训练集与测试集上的混淆矩阵参见图 3(A、B)。混淆矩阵中对角线上的值定义了正确预测元音的比例,非对角线上的值则是未能正确预测的比例。从结果可以看出,初始结构是无法完成识别任务的。
图 3 中的 C 和 D 展示了优化后训练集和测试集上的最终混淆矩阵。这些结果同样是对 5 次交叉验证运行的结果取均值得到的。训练后的混淆矩阵是对角占优的,也就是说现在这个结构可以执行元音识别任务了。

图 3:元音识别任务的训练结果。
图 3 中的 E 和 F 分别展示了交叉熵损失和预测准确率,横坐标是训练集和测试集上的训练 epoch 数。图中的实线表示平均值,阴影区域则是交叉验证训练运行的标准差。从中我们看到第一个 epoch 使损失下降了最多,而且对于准确率的提升也是最大的。从图 3F 中可以看出,这个系统在训练集上的平均准确率是 92.6 ±1.1%,而在测试集上的平均准确率是 86.3 ± 4.3%。
从图 3 的 C 和 D 中可以观察到系统在元音 ae 的识别上表现近乎完美,也能很好地将 iy 和 ei 分辨开来(不过准确率稍低),这种特征在测试集的未见样本上尤为明显。图 3 的 G 到 I 展示了:将每个元音类的代表性样本注入到训练结构中时的综合场强分布(integrated field intensity)∑_t u_t^2。
该研究用视觉化的方式证明了,产生目标结构的优化过程将大部分信号发送至正确的地方。该任务以传统 RNN 作为性能基准,其分类准确率与波动方程差不多,但是它需要大量自由参数。此外,我们观察到,训练线性波动方程所获得的分类准确率也是很有竞争力的,有关性能的更多细节会参见原论文。
讨论
该研究提出的这种基于波的 RNN 有很多优势,这些优势使得它在处理时序编码信息时可以得心应手。与传统 RNN 不同,波动方程在从一个时间步到另一个时间步的更新过程中,通过拉普拉斯算子(图 1E 中的稀疏矩阵)实现隐藏状态元素之间的最近邻耦合。最近邻耦合主要得益于,波动方程是信息以有限速度传播的双曲型偏微分方程。因此,模拟 RNN 的隐藏状态大小和存储容量直接取决于传播介质的大小。此外,与传统 RNN 不同的是,波动方程遵循能量守恒约束,防止隐藏状态和输出信号的范数无限增长。相比之下,定义标准 RNN 更新关系的无约束密集矩阵会导致梯度消失和爆炸,这是传统 RNN 训练过程中的主要挑战。
该研究证明波动方程在概念上等价于 RNN。这种概念上的联系为一类新的模拟硬件平台提供了思路,在这类平台中,演化时序在物理和数据集中都扮演着重要的角色。当我们专注于用标量波动方程描述的最普遍波动示例时,我们的结果可以很容易地扩展到其他类似于波的物理概念。这种利用物理执行计算的方法可能促进新型模拟机器学习设备新平台的研发,模拟设备有望比对应的数字设备更自然高效地执行计算。该方法的通用性进一步表明,许多物理系统可能是对动态信号(如光学、声学或地震学中的动态信号)执行类 RNN 计算的有力候选者。
参考链接:https://www.reddit.com/r/MachineLearning/comments/ej3bgf/r_acoustic_optical_and_other_types_of_waves_are/

    推荐阅读
  • 如何提高质量管理意识(怎样提高质量管理意识)

    要组织员工时常参加一些优秀的产品的展览以及废品事故等的展览。举行一些相关的比赛,鼓舞员工提升质量的激情。多进行一些技术相关的培训,提高员工整体技能以及工作素质。设立考试制度,员工的升级和考试成绩挂钩。加强管理,实行连带责任,一人做不好要一群人受牵连。实行一些质量相关的奖惩制度,做得好就要鼓励,做不好就要适当的惩罚,员工别的可以不管,钱不能不要。

  • 今日推荐绘本:没头脑和不高兴(今日推荐绘本:没头脑和不高兴)

    也感谢任溶溶爷爷,他的故事为我们的童年也留下了美好的回忆。

  • 迷你世界打石巨人boss要什么石块(迷你世界大boss石巨人)

    说起迷你世界里面的石巨人,大家应该都不陌生,因为毕竟是四大boss之一了。击败石巨人赢得奖励的方法。首先要做到知己知彼,石巨人一共有三个形态,当然了。等到第一个石巨人被打死了之后的第二个石巨人他就站起来了。这也是最难打的一个石巨人的形态。撒冰块,扔炸弹,发射激光,这是石巨人的经典攻击顺序,记好了能够减少自己血量的一些消耗。

  • 汽车减振器提供的作用(汽车减振器基础知识)

    减振器的类型一般常见减振器类型有,液压减振器、弹簧减振器、橡胶减振器、气垫减振器等。汽车上的减振器大都是液压减振器,下面就说说液压减振器的作用。减振器的作用减震器主要用来抑制弹簧吸震后反弹时的震荡及来自路面的冲击。

  • 淘宝店起名技巧(淘宝店起名技巧有哪些)

    淘宝店起名技巧淘宝网店取名可以用有名的人或物作为网店名。名字+行业,是我国传统店铺的命名方法。淘宝网店取名可以在你网店名前冠上有名气的网店字眼。把淘宝有名气的店铺的名字巧妙的运用在店铺的名字中,也是一种好的方法。值得注意的是,目标店名最好是和自己店铺主营项目相关的店铺。此外,功能名关键词还可以获得精准的搜索流量,转化率也更高。

  • 拆迁承租人补偿规定(承租人有赔偿吗)

    接下来我们就一起去了解一下吧!拆迁承租人补偿规定1.与房东解除租赁协议的在房屋拆迁时,如果你和房屋产权人,也就是房东达成协议,解除租赁合同的,或者被拆迁人给你进行安置的,那么,拆迁人对房东给予补偿后,就不再给你补偿了。拆迁补偿项目中属于承租户的费用要根据《国有土地上房屋征收与补偿条例》第二条规定,为了公共利益的需要,征收国有土地上单位、个人的房屋,应当对被征收房屋所有权人给予公平补偿。

  • 一周一次轻断食可以瘦么(为什么不仅不伤身甚至减肥效果还非常好)

    这种断食法就合了懒人的心了,每天赖床到十一点起来吃午餐,中午两点加个餐,晚上七点再吃个晚餐,完美控制在8小时内。隔天断食法一天吃,一天不吃。往往只有健身断食高阶者备赛时或者僧侣的宗教习惯才用这种断食法。

  • 逦怎么读(逦的读音)

    逦,汉语汉字,拼音是lǐ迤逦:犹迤逦曲折连绵貌逦倚:谓高低曲折,下面我们就来说一说关于逦怎么读?我们一起去了解并探讨一下这个问题吧!出了北门,迤逦望骊山而去。

  • 曹操败走华容道的故事(发生了什么事)

    曹操败走华容道的故事赤壁一战,曹军大败。曹操领着残兵败将狼狈逃命,一路上连遭伏兵劫杀,最后只剩三百余骑往华容道走去。这又正是最严寒的季节,其苦不可胜言。走了很久后,曹操在马上扬着鞭子大笑。话还没说完,一声炮响,两边五百校刀手摆过,大将关羽提青龙刀,跨赤兔马,截住了他们去路。曹军见了,亡魂丧胆,面面相觑。

  • 大学生上学必备物品(大学入学必备物品清单请查收)

    开学在即,大一新生将迎来憧憬已久的大学生活。各位准大学生们做好准备了吗?报到时应该带哪些证件、物品?这份大学入学必备物品清单请查收来源:陕西省教育厅