肥宅钓鱼网
当前位置: 首页 钓鱼百科

一个简单的预测模型(小模型大趋势Google提出两个模型)

时间:2023-07-08 作者: 小编 阅读量: 2 栏目名: 钓鱼百科

渐进式训练已用于图像分类、GANs和语言模型,并取得了不错的效果。受这一观察结果的启发,研究人员进一步将研究范围扩展到卷积神经网络之外,以期找到更快、更准确的视觉模型。尺寸随着每个阶段继续减小。与之前ViT中的Transformer块不同,这里使用阶段之间的池化,类似于FunnelTransformer。最后,我们分类头来生成类别预测概率。CoAtNet模型在许多数据集中始终优于ViT模型及其变体。研究人员还在大规模JFT数据集上评估了CoAtNets。

一个简单的预测模型?来源:Google AI编辑:LRS,下面我们就来聊聊关于一个简单的预测模型?接下来我们就一起去了解一下吧!

一个简单的预测模型

来源:Google AI

编辑:LRS

【新智元导读】模型在更小、更快和更准之间矛盾吗?能同时达到这几个效果吗?Google Research提出两个模型EfficientNetV2和CoAtNet,竟然同时做到了这三点,模型下降7倍,训练速度提升10倍,还能拿到sota!

随着神经网络模型和训练数据规模的增长,训练效率正成为深度学习的一个重要焦点。

GPT-3 在小样本学习中表现出卓越的能力,但它需要使用数千个 GPU 进行数周的训练,因此很难重新训练或改进。

相反,如果可以设计出更小、更快、但更准确的神经网络会怎样?

Google 就提出了两类通过神经架构和基于模型容量和泛化性的原则性设计方法(principled design methodology)得到的神经网络模型用来图像识别。

第一个是ICML 2021上提出的EfficientNetV2,主要由卷积神经网络组成,旨在为相对较小的数据集(如ImageNet1k,有128万张图像)提供更快的训练速度。

EfficientNet V2基于以前的EfficientNet架构,为了改进原有的方法,Google 研究团队系统地研究了现代模型TPU/GPU上的训练速度瓶颈,有几个发现:

1、使用非常大的图像进行训练会导致更高的内存使用率,从而导致TPU/GPU上的训练速度通常较慢;

2、广泛使用的深度卷积在TPU/GPU上效率低下,因为它们的硬件利用率较低;

3、常用的uniform compound scaling将卷积网络的每个阶段平均放大,但这并不是最优方法。

为了解决这些问题,研究人员提出了一种面向训练感知的神经架构搜索(train-aware NAS),其中训练速度也包含在优化目标中,并且使用一种以非均匀方式在不同阶段进行缩放,模型代码也已开源。

文章的第一作者是Mingxing Tan,

训练感知 NAS 的架构基于之前的平台感知 platform-aware NAS,但与原方法主要关注推理速度不同,训练感知 NAS 同时优化模型精度、模型大小和训练速度。

模型还扩展了原始搜索空间以包含更多对加速器有利的操作,例如 FusedMBConv 通过删除不必要的操作(例如 平均池化和最大池化)来简化搜索空间。

由此产生的 EfficientNetV2 网络在所有以前的模型上都实现了更高的准确性,同时速度更快,体积缩小了 6.8 倍。

为了进一步加快训练过程,研究人员还提出了一种增强的渐进学习方法(progressive learning),该方法在训练过程中逐渐改变图像大小和正则化幅度。

渐进式训练已用于图像分类、GANs和语言模型,并取得了不错的效果。该方法侧重于图像分类,但与以前的方法不同的是,之前的方法通常以精度换取更高的训练速度,它可以略微提高精度,同时显著减少训练时间。

改进方法的关键思想是根据图像大小自适应地改变正则化强度,如dropout 的概率或数据增强程度。对于相同的网络,较小的图像大小导致网络容量较低,因此需要弱正则化;反之亦然,较大的图像大小需要更强的正则化来防止过度拟合。

在 ImageNet 和一些迁移学习数据集上,例如 CIFAR-10/100、Flowers 和 Cars 来评估 EfficientNetV2 模型。在 ImageNet 上,EfficientNetV2 显着优于以前的模型,训练速度提高了约 5-11 倍,模型尺寸缩小了 6.8 倍,准确率没有任何下降。

第二类是CoAtNet,一种结合了卷积和自注意的混合模型,其目标是在大规模数据集上实现更高的精度,如ImageNet21(有1300万张图像)和JFT(有数十亿张图像)。

虽然EfficientNetV2仍然是一个典型的卷积神经网络,但最近对视觉Transformer(visual Transformer, ViT)的研究表明,基于注意的Transfomer 模型在JFT-300M等大规模数据集上的性能优于卷积神经网络。

受这一观察结果的启发,研究人员进一步将研究范围扩展到卷积神经网络之外,以期找到更快、更准确的视觉模型。

研究者系统地研究如何结合卷积和自注意力来开发用于大规模图像识别的快速准确的神经网络。工作结果基于一个观察结论,即卷积由于其归纳偏差(inductive bias)通常具有更好的泛化能力(即训练和评估之间的性能差距),而自注意力Transformer由于其对全局建模的能力更强,所以往往具有更强大的概括能力(即适应大规模训练的能力) 。

通过结合卷积和自注意力,得到的混合模型可以实现更好的泛化和更大的容量。

深度卷积和自注意力可以通过简单的相对注意力自然地统一起来,并且垂直堆叠卷积层和注意力层,可以同时考虑到每个阶段所需的容量和计算能力,从而提高泛化性、容量和效率。

在 CoAtNet 架构中,给定大小为 HxW 的输入图像,首先在第一个stem阶段 (S0) 应用卷积并将大小减小到 H/2 x W/2。尺寸随着每个阶段继续减小。Ln 是指层数。前两个阶段(S1和S2)主要采用深度卷积组成的MBConv构建块。后两个阶段(S3和S4)主要采用具有relative self-attention的Transformer块。与之前 ViT 中的 Transformer 块不同,这里使用阶段之间的池化,类似于 Funnel Transformer。最后,我们分类头来生成类别预测概率。

CoAtNet 模型在许多数据集(例如 ImageNet1K、ImageNet21K 和 JFT)中始终优于 ViT 模型及其变体。与卷积网络相比,CoAtNet 在小规模数据集 (ImageNet1K) 上表现出相当的性能,并且随着数据大小的增加(例如在 ImageNet21K 和 JFT 上)取得了可观的收益。

研究人员还在大规模 JFT 数据集上评估了 CoAtNets。为了达到类似的准确度目标,CoAtNet 的训练速度比以前的 ViT 模型快 4 倍,更重要的是,在 ImageNet 上达到了 90.88% 的新的最先进的 top-1 准确度。

与以前的结果相比,新提出的模型速度快了4-10倍,同时在完善的ImageNet数据集上实现了最先进的90.88%top-1精度。

参考资料:

http://ai.googleblog.com/2021/09/toward-fast-and-accurate-neural.html?m=1

    推荐阅读
  • 什么样的男人值得嫁(什么样的男人值得女人嫁)

    要看这个男人的性格脾气。同时,这个男人要有事业心,但是不能是一个一味地以工作为中心的工作狂,工作狂只以工作为终极目的,缺少了对家人、对孩子、对妻子的温情与关爱,是不值得托付终生的。也会因生活没有情趣而导致感情越来越淡,甚至最终因感情不和而离婚收场。

  • 祝身体祝福语暖心句子(祝福身体健康的话)

    在人生中,健康的价值远胜过声望和财富。愿您劳逸适度,多加保重。以自然之道,养自然之身。一个人当他浑然忘却了自己年龄时,才是最健壮的时期。一笑烦恼跑;二笑怨憎消;三笑憾事了;四笑病魔逃;五笑永不老;六笑乐逍遥。

  • 张柏芝都有什么奖(曾经风光无限的金像奖影后张柏芝是怎么糊掉的)

    说起张柏芝80,90的吃瓜观众并不陌生,曾经是多少男的梦中情人,不仅有过硬的作品,年纪轻轻地就获得香港金像奖影后桂冠,被香港人最期待未来的香港女演员支柱,而且和谢霆锋的感情事情分分合合闹得满城风雨,一时风光无限。最后其实也是受大环境影响,香港商业电影越来越不景气,香港艺人的资源都不怎么样,好的资源都在内地演员手中,像张柏芝这种有价无市的过气艺人更不可能拿到什么好资源,太垃圾的资源也太降身价。

  • 战狼跟吴京合作的男演员(她在战狼2助吴京成影坛霸主)

    她在战狼2助吴京成影坛霸主我们看到这个标题一定会非常的好奇,这位演员是谁?这位著名的女演员就是卢靖姗,今天她和韩庚在新西兰完婚,2008年卢靖姗首次触电,在吴京自导自演动作电影《狼牙》中饰演女主角女警杜晓禾,2017年和吴京合。

  • 体现友情的诗句有哪些(盘点体现友情的诗句)

    体现友情的诗句有哪些响必应之与同声,道固从至于同类。骆宾王《萤火赋》四海皆兄弟,谁为行路人。汉.无名氏《别诗四首》海内存知己,天涯若比邻。王勃《杜少府之任蜀州》结交在相知,骨肉何必亲。汉乐府《箜篌谣》鼋鸣而鳖应,兔死则狐悲。明田艺蘅《玉笑零音》坐上客恒满,樽中饮不空。孔融《诗》采葵莫伤根,伤根葵不生。——王勃《秋日登洪府滕王阁饯别序》人生交契无老少,论交和必先同调。

  • 芝士排骨的做法(如何做芝士排骨)

    以下内容大家不妨参考一二希望能帮到您!芝士排骨的做法材料:排骨500、芝士1葱姜蒜适量、糖>40g。再蒜姜辣椒,油里爆香加排骨煎至金黄,加糖酱油、料酒、辣椒小火到汤汁浓稠再收会儿汁,汁可以把排骨裹的特别漂亮的程度。然后换平底锅,把芝士均匀的铺开,少许黑胡椒,葱花、小火加热、等芝士可以拉丝,然后把排骨一块块放进去沾芝士吃就可以了。

  • 开套牌车扣多少分 开套牌车扣几分

    对于套牌车的处罚根据新规驾驶套牌车由公安机关交通管理部门予以收缴,扣留该机动车,处2000-5000元罚款,驾驶证记12分,扣留机动车,情节严重可以处15日内行政拘留。对于套牌车本身是问题车,处罚更加严厉交警部门查获的套牌车中,相当一部分还是问题车,比如是盗窃、抢劫、走私而来的汽车。伪造、变造、买卖机动车牌证及机动车入户、过户、验证的有关证明文件的,构成犯罪的,依照《刑法》第二百八十条第一款的规定处罚。

  • 仙桃市属于哪个市(仙桃市简述)

    接下来我们就一起去研究一下吧!仙桃市属于哪个市湖北省仙桃市是湖北省的直管县级市。仙桃原名沔阳,位于湖北省中南部的江汉平原腹地,面积2538平方公里,地跨东经112°55'—113°49'、北纬30°04'—30°32'。仙桃历史文化悠久,经济充满活力,是全国百强县(市)、湖北首强县(市)、全国卫生城市、全国绿化先进市。

  • 儿童益智华容道怎么玩(婴幼儿玩具探秘第八期)

    全新一季的《最强大脑》开播啦!在不断怀疑自己的耳朵和智商的过程中,给小编留下最深印象的是节目最开始玩的《数字华容道》的项目。按说有这么明显的历史典故,华容道这种玩具的来历已经很明显了,这肯定是来自咱们中国呀。虽然华容道的来历还没有个明确的说法,但这一点都不妨碍它的烧脑好玩。各位小伙伴们,你们觉得华容道到底是咱们传统的玩具,还是是舶来品呢?

  • 合肥市包河区芜湖路街道社康九价HPV预约(3月11日)

    合肥市包河区芜湖路街道社区卫生服务中心九价HPV疫苗预约接种通知!合肥市包河区芜湖路街道社区卫生服务中心九价HPV疫苗将于2023年03月11日09:00在医鹿App平台开放线上预约,九价HPV疫苗预约名额140人份。确认提交,操作成功后系统会自动提示本次预约成功,并会收到系统发送的短信确认码。