肥宅钓鱼网
当前位置: 首页 钓鱼百科

一个简单的预测模型(小模型大趋势Google提出两个模型)

时间:2023-07-08 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

渐进式训练已用于图像分类、GANs和语言模型,并取得了不错的效果。受这一观察结果的启发,研究人员进一步将研究范围扩展到卷积神经网络之外,以期找到更快、更准确的视觉模型。尺寸随着每个阶段继续减小。与之前ViT中的Transformer块不同,这里使用阶段之间的池化,类似于FunnelTransformer。最后,我们分类头来生成类别预测概率。CoAtNet模型在许多数据集中始终优于ViT模型及其变体。研究人员还在大规模JFT数据集上评估了CoAtNets。

一个简单的预测模型?来源:Google AI编辑:LRS,下面我们就来聊聊关于一个简单的预测模型?接下来我们就一起去了解一下吧!

一个简单的预测模型

来源:Google AI

编辑:LRS

【新智元导读】模型在更小、更快和更准之间矛盾吗?能同时达到这几个效果吗?Google Research提出两个模型EfficientNetV2和CoAtNet,竟然同时做到了这三点,模型下降7倍,训练速度提升10倍,还能拿到sota!

随着神经网络模型和训练数据规模的增长,训练效率正成为深度学习的一个重要焦点。

GPT-3 在小样本学习中表现出卓越的能力,但它需要使用数千个 GPU 进行数周的训练,因此很难重新训练或改进。

相反,如果可以设计出更小、更快、但更准确的神经网络会怎样?

Google 就提出了两类通过神经架构和基于模型容量和泛化性的原则性设计方法(principled design methodology)得到的神经网络模型用来图像识别。

第一个是ICML 2021上提出的EfficientNetV2,主要由卷积神经网络组成,旨在为相对较小的数据集(如ImageNet1k,有128万张图像)提供更快的训练速度。

EfficientNet V2基于以前的EfficientNet架构,为了改进原有的方法,Google 研究团队系统地研究了现代模型TPU/GPU上的训练速度瓶颈,有几个发现:

1、使用非常大的图像进行训练会导致更高的内存使用率,从而导致TPU/GPU上的训练速度通常较慢;

2、广泛使用的深度卷积在TPU/GPU上效率低下,因为它们的硬件利用率较低;

3、常用的uniform compound scaling将卷积网络的每个阶段平均放大,但这并不是最优方法。

为了解决这些问题,研究人员提出了一种面向训练感知的神经架构搜索(train-aware NAS),其中训练速度也包含在优化目标中,并且使用一种以非均匀方式在不同阶段进行缩放,模型代码也已开源。

文章的第一作者是Mingxing Tan,

训练感知 NAS 的架构基于之前的平台感知 platform-aware NAS,但与原方法主要关注推理速度不同,训练感知 NAS 同时优化模型精度、模型大小和训练速度。

模型还扩展了原始搜索空间以包含更多对加速器有利的操作,例如 FusedMBConv 通过删除不必要的操作(例如 平均池化和最大池化)来简化搜索空间。

由此产生的 EfficientNetV2 网络在所有以前的模型上都实现了更高的准确性,同时速度更快,体积缩小了 6.8 倍。

为了进一步加快训练过程,研究人员还提出了一种增强的渐进学习方法(progressive learning),该方法在训练过程中逐渐改变图像大小和正则化幅度。

渐进式训练已用于图像分类、GANs和语言模型,并取得了不错的效果。该方法侧重于图像分类,但与以前的方法不同的是,之前的方法通常以精度换取更高的训练速度,它可以略微提高精度,同时显著减少训练时间。

改进方法的关键思想是根据图像大小自适应地改变正则化强度,如dropout 的概率或数据增强程度。对于相同的网络,较小的图像大小导致网络容量较低,因此需要弱正则化;反之亦然,较大的图像大小需要更强的正则化来防止过度拟合。

在 ImageNet 和一些迁移学习数据集上,例如 CIFAR-10/100、Flowers 和 Cars 来评估 EfficientNetV2 模型。在 ImageNet 上,EfficientNetV2 显着优于以前的模型,训练速度提高了约 5-11 倍,模型尺寸缩小了 6.8 倍,准确率没有任何下降。

第二类是CoAtNet,一种结合了卷积和自注意的混合模型,其目标是在大规模数据集上实现更高的精度,如ImageNet21(有1300万张图像)和JFT(有数十亿张图像)。

虽然EfficientNetV2仍然是一个典型的卷积神经网络,但最近对视觉Transformer(visual Transformer, ViT)的研究表明,基于注意的Transfomer 模型在JFT-300M等大规模数据集上的性能优于卷积神经网络。

受这一观察结果的启发,研究人员进一步将研究范围扩展到卷积神经网络之外,以期找到更快、更准确的视觉模型。

研究者系统地研究如何结合卷积和自注意力来开发用于大规模图像识别的快速准确的神经网络。工作结果基于一个观察结论,即卷积由于其归纳偏差(inductive bias)通常具有更好的泛化能力(即训练和评估之间的性能差距),而自注意力Transformer由于其对全局建模的能力更强,所以往往具有更强大的概括能力(即适应大规模训练的能力) 。

通过结合卷积和自注意力,得到的混合模型可以实现更好的泛化和更大的容量。

深度卷积和自注意力可以通过简单的相对注意力自然地统一起来,并且垂直堆叠卷积层和注意力层,可以同时考虑到每个阶段所需的容量和计算能力,从而提高泛化性、容量和效率。

在 CoAtNet 架构中,给定大小为 HxW 的输入图像,首先在第一个stem阶段 (S0) 应用卷积并将大小减小到 H/2 x W/2。尺寸随着每个阶段继续减小。Ln 是指层数。前两个阶段(S1和S2)主要采用深度卷积组成的MBConv构建块。后两个阶段(S3和S4)主要采用具有relative self-attention的Transformer块。与之前 ViT 中的 Transformer 块不同,这里使用阶段之间的池化,类似于 Funnel Transformer。最后,我们分类头来生成类别预测概率。

CoAtNet 模型在许多数据集(例如 ImageNet1K、ImageNet21K 和 JFT)中始终优于 ViT 模型及其变体。与卷积网络相比,CoAtNet 在小规模数据集 (ImageNet1K) 上表现出相当的性能,并且随着数据大小的增加(例如在 ImageNet21K 和 JFT 上)取得了可观的收益。

研究人员还在大规模 JFT 数据集上评估了 CoAtNets。为了达到类似的准确度目标,CoAtNet 的训练速度比以前的 ViT 模型快 4 倍,更重要的是,在 ImageNet 上达到了 90.88% 的新的最先进的 top-1 准确度。

与以前的结果相比,新提出的模型速度快了4-10倍,同时在完善的ImageNet数据集上实现了最先进的90.88%top-1精度。

参考资料:

http://ai.googleblog.com/2021/09/toward-fast-and-accurate-neural.html?m=1

    推荐阅读
  • 湖南米粉排名前三名(湖南米粉二十强排行榜)

    湖南米粉二十强排行榜前言湖南米粉历经二千多年的发展历程,从汉代“臛浇豚皮饼”(肉汤扁粉),到清末涌现的圆粉,再到今天各地市米粉百家争鸣,期间渊源流变、开花散叶,众说纷纭,莫衷一是因此,当下需要对湖南种种米粉分门别类,作出。

  • 老枪战争片电影推荐(动作电影二凤今日上映)

    由黎文杰执导,实力派动作女星吴青芸领衔主演的电影《二凤》今日正式公映。除了开启年度最强救援外,本片对母女亲情的描摹极其触动人心。该片已在越南本土收获超高票房,观众口碑好评如潮。电影中,海芙蓉与黑帮分子的贴身肉搏都是真人演绎,不仅拳速迅猛,也体现了女主刚强的一面。因斩获越南电影节影后,从此奠定了影坛实力派的地位。目前,动作电影《二凤》已全国上映,一切精彩尽在大银幕为你呈现。

  • 爱奇艺电影券怎么获得 爱奇艺电影券怎么获得最快

    爱奇艺电影券获得的方法有:1、购买爱奇艺黄金VIP会员后,每月都会赠送点播券。则影片上方标有用券二字的可以用点播券观看,VIP会员成长福利也会赠送点播券。

  • 宝雕350rr怎么样 宝雕450rr

    动力系统搭载250缸水冷电喷发动机,最大功率20kW,最大扭矩19.6Nm。厂家指导价42900元。该车有两款直列双缸400cc和450cc排量发动机供消费者选择。目前,怪兽汽车在全球的销量已超过24.5万辆。BD350-5A搭载332cc水冷四冲程双缸化油器发动机,前双盘制动液晶仪表,单边双出排气不落。售价15800元物美价廉。这款车在2009年一经推出就震惊了整个摩托车行业。进口摩托车价格高也是一大原因。

  • 总有你鼓励歌词(总有你鼓励的歌曲歌词介绍)

    下面希望有你要的答案,我们一起来看看吧!

  • 五本让你热血沸腾的小说(八本废物逆袭热血小说)

    果然,进入其中之后,那罡风、火焰对身躯的破坏速度和修复速度基本持平。对身躯的淬炼效果也是最好。如此,过了大半年时间,这云朵对他便再无用处,在其中他的身体再没有受到任何伤害。因为他们发现,打在白晨身上,痛在他们的拳脚上,反观白晨的脸色,反而像是享受一般。从此,千军辟易,百万军中取敌首脑如同探囊取物。更倒霉的是,身体发软之际,又被林锋脚下扩散出来的泥圈给绊倒,一干匪徒全都都栽倒在

  • 凉席什么材质好用(什么材质的凉席好用)

    竹子具有抗菌、柔软滑爽,耐磨透气效果,带着点点清香,老少儿童在夏天都可以使用。牛皮席牛皮席是属于价高物也美的一类高档家用品,手感舒适、防潮和防热效果都非常棒,保养也非常轻松和方便。亚麻席亚麻席具有透气、吸湿和排湿性,能将吸收到的汗液及热量迅速传导出去,卫生性能也非常好,能抑制真菌和微生物的生长。亚麻席与皮床搭配也是最好的选择,给人一种享受美的感觉,温暖欢快,幸福愉悦的渡过夏天的每一个夜晚。

  • 品牌私域运营的发展阶段(品牌要不要打造)

    IP化成为当下新品牌异军突起的利器,也是老品牌焕发新生的法宝。然而,想要搭乘IP化的东风也并非易事。而在私域运营中,IP就是企业或品牌的人格化表现。把抽象的品牌、企业,具象化为鲜明的人格形象,就是品牌的IP化。屈臣氏创造了一个虚拟人物IP作为品牌代言人,名叫屈晨曦,英文名Wilson。这是屈臣氏经过数据调研分析后,打造出的符合品牌粉丝喜好的形象。

  • 回家过年时的经典语录(春节又到回乡时)

    许公邀其共饮,少年也并未过多推辞,欣然同乐。眼见东方天际将白,许公仍然毫无所获,不禁间感到几分失落。将手中婴儿抛上岸边,举手蹬地啼哭不已。当妇女淹溺水中时,许公于心不忍,几番想上前救助。但转念又想到该女子是替六郎而死,便止住了恻隐之心。众人纷至沓来,将许公围绕其中如一堵立起的人墙。一天之内更换数个主人。许公再三坚决要离别回乡。离别之日更是男女老少聚集一起送许公走出村外。

  • 藕怎么选(如何选购莲藕)

    以下内容希望对你有帮助!莲藕外皮颜色要呈微黄色,如果发黑或有异味,这样的不能要了。莲藕本身只有一股泥土味,如果有酸味,说明是用工业药剂处理过的,对人体有害。选择通气孔较大的。尽量购买这样的莲藕,比较好吃。特别是做姜汁藕片,味道很棒。选择内外没有损伤的。购买莲藕时,要注意有无明显外伤。如果有泥土包裹着莲藕,应该把泥土擦一擦,看莲藕表面有无伤痕,如果伤痕很明显的不要购买了。