肥宅钓鱼网
当前位置: 首页 钓鱼百科

斯坦福实验研究(斯坦福大学新研究)

时间:2023-06-17 作者: 小编 阅读量: 3 栏目名: 钓鱼百科

波动与RNN的联系这一部分将介绍RNN的操作与波动之间的联系。该任务以传统RNN作为性能基准,其分类准确率与波动方程差不多,但是它需要大量自由参数。此外,与传统RNN不同的是,波动方程遵循能量守恒约束,防止隐藏状态和输出信号的范数无限增长。相比之下,定义标准RNN更新关系的无约束密集矩阵会导致梯度消失和爆炸,这是传统RNN训练过程中的主要挑战。该研究证明波动方程在概念上等价于RNN。

选自Reddit

作者:Ian Williamson机器之心编译
参与:王子嘉、魔王

斯坦福大学的一项研究发现:物理学中波动与 RNN 中的计算存在对应关系。



论文地址:https://advances.sciencemag.org/content/5/12/eaay6946GitHub 地址:https://github.com/fancompute/wavetorch
最近,机器学习与物理和数值科学的一些领域碰撞出了不少火花。这让机器学习框架在物理模型优化问题中有了用武之地,同时机器学习领域也在物理概念的帮助下出现了很多令人兴奋的新模型(如神经 ODE 和哈密顿神经网络等)。
本文作者所在小组的研究重点是:物理本身就可以作为计算引擎。换句话说,作者们感兴趣的是那些可以作为硬件加速器(或是专门用于快速高效的机器学习计算的模拟处理器)的物理系统。
他们最近发表在《Science Advances》上的论文,证明了波的物理特性可被直接映射到循环神经网络的时序变化。利用这种联系,作者们通过 PyTorch 开发了一个数值模型,该模型证明我们可以训练一个声学/光学系统,并利用它从人类说话者录音中准确地识别出元音。本质上,作者们将元音元音波形引入物理模型,并允许优化器在域内的 1000 个点上添加和删除材料,这个操作实际上可以当做模型的权重。
因为这个机器学习模型实际上对应于一个物理系统,这也就意味着研究者可以把经过训练的材料分布「打印」到真实的物理设备中。其结果类似于 ASIC (Application Specific Integrated Circuit),但只能针对特定的 RNN 计算。这令人感到非常兴奋,因为这些结果表明可以在不消耗多余能量(除了脉冲本身携带的能量)的情况下,执行复杂的循环机器学习计算。
以下是对这篇研究核心思想的介绍。
波动与 RNN 的联系
这一部分将介绍 RNN 的操作与波动之间的联系。
RNN 一步步对输入序列的每一部分执行相同的操作,从而将输入序列转换成输出序列(图 1A)。之前步的信息被编码存储在 RNN 的隐藏状态中,隐藏状态在每一步都会更新。正是这些隐藏状态使得 RNN 记住过去的信息,同时学习数据中的时序结构和长距离依赖关系。在给定时间步 t 处,RNN 同时处理输入序列中的当前输入向量 x_t 以及前一步传来的隐藏状态向量 h_t-1,从而得到输出向量 y_t,并更新当下的隐藏状态 h_t。

图 1:标准 RNN 与基于波的物理系统之间的概念比较。
训练一个分辨元音的物理系统
这一部分将说明如何使用波动方程来训练元音分类器,其主要通过构建非均匀材料分布来实现。为了完成这个任务,该研究所用数据集包含 45 位男性和 48 位女性关于 10 个元音的 930 条原始录音。在模型训练过程中,该研究选取了关于这 3 个元音(ae、ei、iy)的 279 条录音作为训练集(图 2A)。

图 2:元音识别的设置和训练过程示意图。
对初始网络 5 次交叉验证训练的结果取均值后得到的训练集与测试集上的混淆矩阵参见图 3(A、B)。混淆矩阵中对角线上的值定义了正确预测元音的比例,非对角线上的值则是未能正确预测的比例。从结果可以看出,初始结构是无法完成识别任务的。
图 3 中的 C 和 D 展示了优化后训练集和测试集上的最终混淆矩阵。这些结果同样是对 5 次交叉验证运行的结果取均值得到的。训练后的混淆矩阵是对角占优的,也就是说现在这个结构可以执行元音识别任务了。

图 3:元音识别任务的训练结果。
图 3 中的 E 和 F 分别展示了交叉熵损失和预测准确率,横坐标是训练集和测试集上的训练 epoch 数。图中的实线表示平均值,阴影区域则是交叉验证训练运行的标准差。从中我们看到第一个 epoch 使损失下降了最多,而且对于准确率的提升也是最大的。从图 3F 中可以看出,这个系统在训练集上的平均准确率是 92.6 ±1.1%,而在测试集上的平均准确率是 86.3 ± 4.3%。
从图 3 的 C 和 D 中可以观察到系统在元音 ae 的识别上表现近乎完美,也能很好地将 iy 和 ei 分辨开来(不过准确率稍低),这种特征在测试集的未见样本上尤为明显。图 3 的 G 到 I 展示了:将每个元音类的代表性样本注入到训练结构中时的综合场强分布(integrated field intensity)∑_t u_t^2。
该研究用视觉化的方式证明了,产生目标结构的优化过程将大部分信号发送至正确的地方。该任务以传统 RNN 作为性能基准,其分类准确率与波动方程差不多,但是它需要大量自由参数。此外,我们观察到,训练线性波动方程所获得的分类准确率也是很有竞争力的,有关性能的更多细节会参见原论文。
讨论
该研究提出的这种基于波的 RNN 有很多优势,这些优势使得它在处理时序编码信息时可以得心应手。与传统 RNN 不同,波动方程在从一个时间步到另一个时间步的更新过程中,通过拉普拉斯算子(图 1E 中的稀疏矩阵)实现隐藏状态元素之间的最近邻耦合。最近邻耦合主要得益于,波动方程是信息以有限速度传播的双曲型偏微分方程。因此,模拟 RNN 的隐藏状态大小和存储容量直接取决于传播介质的大小。此外,与传统 RNN 不同的是,波动方程遵循能量守恒约束,防止隐藏状态和输出信号的范数无限增长。相比之下,定义标准 RNN 更新关系的无约束密集矩阵会导致梯度消失和爆炸,这是传统 RNN 训练过程中的主要挑战。
该研究证明波动方程在概念上等价于 RNN。这种概念上的联系为一类新的模拟硬件平台提供了思路,在这类平台中,演化时序在物理和数据集中都扮演着重要的角色。当我们专注于用标量波动方程描述的最普遍波动示例时,我们的结果可以很容易地扩展到其他类似于波的物理概念。这种利用物理执行计算的方法可能促进新型模拟机器学习设备新平台的研发,模拟设备有望比对应的数字设备更自然高效地执行计算。该方法的通用性进一步表明,许多物理系统可能是对动态信号(如光学、声学或地震学中的动态信号)执行类 RNN 计算的有力候选者。
参考链接:https://www.reddit.com/r/MachineLearning/comments/ej3bgf/r_acoustic_optical_and_other_types_of_waves_are/

    推荐阅读
  • 刘德华港片经典台词(人潮汹涌刘德华贡献的四段台词)

    刘德华港片经典台词电影《人潮汹涌》是一个喜剧,也是一个完美的爱情片,冲动的犯罪片,小人物的成长的励志片,以及从对演员这个职业的示范片。李想和周全有彼此魅力的吸引,也有互相鼓励的奋进,更有英雄救美般的剧情设计。为什么观众会吐槽某些演员的演技差,当看完《人潮汹涌》后如果还不明白,那真该替陈小萌挨那三巴掌。

  • 南京天空出现丁达尔(惊艳郑州上空频现)

    连续多日,郑州上空白云飘飘,平时罕见的“丁达尔现象”也频频出现。当一束光线透过胶体,从入射光的垂直方向可以观察到胶体里出现的一条光亮的“通路”,这种现象被称为丁达尔现象。丁达尔现象是1869年由英国科学家约翰·丁达尔率先发现的。光通过云、雾、烟尘也会产生这种现象。8月2日下午,郑州上空再现丁达尔现象,从下午5时30分一直持续到晚上7时太阳落下,阳光透过不断飘过的云彩,将一束束光柱照向天空,十分惊艳。

  • 扭伤用栀子粉外敷多久(关节扭伤外敷栀子)

    每次取若干栀子粉,用鸡蛋清调成糊状,涂于患处,表面盖上一层纱布,用胶布固定,每天换药1次。鸡蛋清具有收敛、滋润、营养、促进肉芽组织生长等作用,并能改善创面局部微循环,加快病损组织修复。方中栀子与鸡蛋清合用,具有显著的消肿祛瘀、理气止痛的功效。

  • 肝功能的介绍 肝的功能主治

    免疫功能通过研究发现肝脏中含有着窦细胞和T淋巴细胞。当上述任何一个环节受到损害时都会影响胆红素的排出。当胆红素的数值超过正常范围的时候,临床上可以考虑是由病毒性肝炎、中毒性肝炎、溶血性黄疸,内出血等原因引起的。当肝细胞受到损害时,血液中的血清酶会随之升高,这些酶的数值正好反映了相应的病理症状。必须由专业医生根据临床经验和多项检查结果来确定某种疾病,并且制定最完善的治疗方案,切不可自行盲目用药。

  • 说某人白月光什么意思(为什么说某人白月光)

    我们一起去了解并探讨一下这个问题吧!说某人白月光什么意思因没有得到过而变得格外美好的事物。语出张爱玲《红玫瑰与白玫瑰》,“也许每一个男子全都有过这样的两个女人,至少两个。娶了红玫瑰,久而久之,红的变了墙上的一抹蚊子血,白的还是床前明月光;娶了白玫瑰,白的便是衣服上沾的一粒饭黏子,红的却是心口上一颗朱砂痣”

  • collection羽绒服女装(品牌女装折扣羽绒服连衣裙裤裙穿搭)

    品牌女装折扣羽绒服连衣裙裤裙穿搭,。

  • 王牌对王牌朱茵第几期(朱茵再演紫霞燕子泪光闪闪)

    现场,朱茵更与饰演“铁扇公主”的蔡少芬以及薛之谦版“至尊宝”、宋茜版“唐僧”一同上演了一段“《大话西游》后传”,神还原的经典场景和爆笑剧情令人捧腹不已。这期王牌对王牌,总是让人不禁想起朱茵和周星驰的恋情,如今只希望各自安好

  • 金泰希韩国女演员(韩国十大美女明星她位居榜首)

    金泰希,韩国女演员,1980年出生于韩国釜山。2000年作为广告模特出道。2001年,凭借爱情电影《礼物》进入演艺圈。2003年,出演爱情剧《天国的阶梯》,该剧最高收视率达42.4%,金泰希因饰演韩友莉而受到关注。金泰希自小天生丽质,多才多艺。毫无瑕疵的外形,奇妙地融合了古典和现代的气质,美目流盼,聪慧逼人,举手投足间,温婉青春的气息扑面而来。台湾某媒体曾评选韩国最美十大女星,金泰希位居榜首。对于这个结果,你赞同吗?

  • 民主生活有辣味(直击一场红脸出汗)

    上午8点半,到会指导的省纪委监委相关监督检查室和查办相关案件的审查调查室负责同志开门见山,剖析去年查处的原祁阳县委书记周新辉严重违纪违法原因,并向祁阳市委提出纪检监察建议,会场的气氛瞬间严肃起来。市委常委们纷纷表示,对提出的问题照单全收,立行立改,整改到位。从上午8点半到下午2点半,专题民主生活会开了整整6个小时。当天,另外两场相同主题的专题民主生活会同步在江永县和新田县召开。

  • 2022应当如何区分借条及欠条(2022应当如何区分借条及欠条呢)

    借条代表的是一种借款合同关系,借款人向出借人借款,出借人给付借款。欠条是对以往双方经济往来的一种结算,表明自欠条形成之日起双方之间形成的一种新的纯粹的债权债务关系。对于约定了还款期限的欠条,自约定的还款期限届满之日起3年内不主张权利的,法律不予以保护;而没有约定还款期限的欠条,自欠条出具之日起3年内不主张权利的,法律不予以保护。