肥宅钓鱼网
当前位置: 首页 钓鱼百科

外国教授教如何解除双下巴(去除双下巴有奇招)

时间:2023-06-16 作者: 小编 阅读量: 1 栏目名: 钓鱼百科

研究思想新研究的核心思想是训练StyleGAN隐空间中精细的分离边界。分离边界是由InterFaceGAN提出的一种隐空间中的超平面,但是InterFaceGAN训练出的分离边界无法分离无关特征。主要研究方向为数字几何处理、虚拟现实和人工智能。第九届霍英东青年教师基金、浙江省杰出青年基金获得者,入选教育部新世纪优秀人才支持计划。2008年获教育部高等学校科学研究优秀成果奖自然科学奖一等奖,2017年获浙江省科技进步二等奖,2015年获美国ACMRecognitionofServiceAward奖。

机器之心专栏

机器之心编辑部

浙江大学计算机辅助设计与图形学国家重点实验室和浙江大学-腾讯游戏智能图形创新技术联合实验室的研究者们提出了训练 StyleGAN 隐空间中精细的分离边界的方法,仅用一个向量就能在保持其它面部特征不变的情况下进行语义特征编辑。该方法在去除双下巴等应用中效果显著。

随着社交网络、直播以及短视频的流行,为了给别人留下更好的印象,人脸编辑「美颜」的应用范围越来越广泛,不断发展的科学技术使人脸编辑产生了非常多的研究分支。其中,生成对抗网络(GAN)的隐空间一直是个热点问题,现在越来越多的工作把注意力放在隐码的操控和隐空间中的语义解耦上。StyleGAN 是一种可生成高质量人脸图像的生成对抗网络,其隐空间具有非常好的线性特性。利用 StyleGAN 的这一特征可以实现高质量、应用场景广泛的人脸编辑。但是,如何在改变特定特征的同时保持其它无关特征不变,即进行特征的解耦,仍然是一个难题。

为解决这一问题,浙江大学计算机辅助设计与图形学国家重点实验室和浙江大学-腾讯游戏智能图形创新技术联合实验室可研究者们提出了训练 StyleGAN 隐空间中精细的分离边界的方法,仅用一个向量就能在保持其它面部特征不变的情况下进行语义特征编辑

以去除双下巴为例,该方法效果显著:

图 1:具有双下巴的肖像图像(第一排),去除双下巴后的新肖像(第二排)。

该研究的论文《Coarse-to-Fine: Facial Structure Editing of Portrait Images via Latent Space Classifications》已被计算机图形学顶级国际学术会议 ACM SIGGRAPH 2021 接收。

论文地址:http://www.cad.zju.edu.cn/home/jin/sig2021/sig2021.htm

研究方向

在 CV 领域里,生成对抗网络的隐空间一直是个热点问题,现在越来越多的工作把注意力放在隐码的操控上。InterFaceGAN 探究了生成对抗网络的隐空间是怎么进行编码的,并且提出了使用一个分离边界对语义属性进行编辑的方法;In-domain GAN 能够将输入的图像反转到生成对抗网络的隐空间中,并且作为正则器对隐码进行微调,并提出一种语义扩散的方法。

鉴于隐空间对于 StyleGAN 研究的重要性,越来越多的工作开始关注如何高效、高质量地将图像反转回 StyleGAN 的隐空间中,并得到相应的隐码;在此基础上,基于 StyleGAN 的投影器可以将图像直接反转回隐空间,从而进行图像到图像的转换,实现人脸姿态改变、人脸之间的线性插值等等功能,Image2StyleGAN 能够将图像反转回隐空间并且进行语义编辑。

将隐码和 3D 模型结合也可以参数化调整人脸特征,GIF 在一种生成 3D 人脸模型(FLAME)上应用 StyleGAN,从而对生成的图像进行显式控制;StyleRig 则基于 StyleGAN 和 3DMM 进行面部绑定控制,参数化调整人脸。

研究思想

新研究的核心思想是训练 StyleGAN 隐空间中精细的分离边界。分离边界是由 InterFaceGAN 提出的一种隐空间中的超平面,但是 InterFaceGAN 训练出的分离边界无法分离无关特征。本文提出精心设计的训练流程,生成成对的仅有特定特征改变的隐码(在去除双下巴的例子中,这些隐码除了有无双下巴外,其它特征基本保持一致),从这些成对隐码中训练精细的分离边界,从而实现面部结构编辑。

该研究首先训练一个双下巴分类器,根据双下巴的有无,对 StyleGAN 的隐空间中的隐码进行评分,随后使用随机采样的隐码及其对应的下巴评分进行训练,得到一个粗糙的分离边界,用来合成没有双下巴的中间肖像。在这过程中,其它面部特征,如人脸形状和姿势,在被粗糙的分离边界编辑后不能很好地保存。

为了解决这一问题,该研究引入了一种语义扩散方法,利用能将双下巴特征从其它特征中分离出来的颈部掩膜,将中间人像的新下巴的语义扩散到原始图像中,从而得到没有双下巴且保持了面部特征的肖像图像及其对应的隐码。最后,该研究利用成对的有双下巴和没有双下巴的隐码训练出一个精细的双下巴分离边界。

在测试阶段,利用精细的双下巴分离边界编辑输入的隐码,并且用图像形变算法优化输入和输出的图像在人脸边缘处细微的错位(misalignment),得到最终结果。

图 2:该研究的流程图,详情请参见论文原文。

结果展示

该研究在大量的肖像图像上测试了方法的性能,这些肖像图像有不同的性别、姿势、脸部形状、肤色。图 3 展示了由该研究提出的方法自动生成的结果。

以去除双下巴为例,该方法可成功地去除输入肖像图像的双下巴,同时很好地保持其它特征不变。

图 3:该研究的结果。前四行为参数连续调整的结果,后四行的每对图像中,左图为原图,右图为得到的结果。

与当前最优的面部编辑方法(SOTA)相比,该研究产生了更稳定和合理的结果,保持了面部特征的不变性,并且符合人脸结构。

图 4:方法对比。第一行为输入肖像图像,第二行为 MaskGAN 的结果,第三行为 SC-FEGAN 的结果,第四行为 Generative Inpainting 方法的结果,最后一行为我们方法的结果。

研究人员希望该研究能够为人脸编辑带来新的思路,同时希望给 StyleGAN 的隐空间研究带来启发。

作者简介

论文第一作者吴奕谦,女,21 岁,浙江大学大四本科生,将在今年 9 月于浙江大学 CAD&CG 国家重点实验室直接攻读博士。研究方向是计算机视觉、人脸编辑。

个人主页:https://onethousandwu.com/

论文作者杨永亮,英国巴斯大学副教授。2009 年于清华大学计算机科学与技术系获得博士学位,2009-2011 年为阿卜杜拉国王科技大学 (KAUST) 博士后研究员,2011 年 9 月至 2014 年 8 月在 KAUST 视觉计算中心担任助理研究员。发表 Siggraph、Siggraph Asia 论文 9 篇。主要研究方向为数字几何处理、虚拟现实和人工智能。

个人主页:http://www.yongliangyang.net/

论文作者肖钦杰,浙江大学 CAD&CG 国家重点实验室博士研究生,本科毕业于浙江大学数学系,研究方向是三维人脸重建、评估与编辑。

论文通讯作者金小刚,浙江大学计算机科学与技术学院教授,博士生导师。“十三五”国家重点研发计划首席科学家,浙江大学 - 腾讯游戏智能图形创新技术联合实验室主任,浙江省虚拟现实产业联盟理事长,中国计算机学会虚拟现实与可视化专委会副主任委员,杭州钱江特聘专家。第九届霍英东青年教师基金、浙江省杰出青年基金获得者,入选教育部新世纪优秀人才支持计划。在 ACM TOG (Proc. of Siggraph)、IEEE TVCG 等国际重要学术刊物上发表论文 140 多篇。2008 年获教育部高等学校科学研究优秀成果奖自然科学奖一等奖,2017 年获浙江省科技进步二等奖,2015 年获美国 ACM Recognition of Service Award 奖。获国际计算机动画学术会议 CASA'2017、CASA'2018 最佳论文奖,《计算机真实感图形的算法基础》获 2001 年国家科技图书二等奖。

    Email: jin@cad.zju.edu.cn。个人主页:http://www.cad.zju.edu.cn/home/jin/
    推荐阅读
  • 祭灶节吃什么糖(盘点祭灶节吃的糖)

    祭灶节吃什么糖吃灶糖,灶糖是一种又粘嘴又粘牙的麦芽糖,把它抽为长条型的糖棍称为“关东糖”,拉制成扁圆型就叫做“糖瓜”。冬天把它放在屋外,因为天气严寒,糖瓜凝固得坚实而里边又有些微小的气泡,吃起来脆甜香酥,别有风味。关东糖,关东糖又称灶王糖、大块糖。关东糖是用麦芽、小米熬制而成的糖制品,它是祭灶神用的。祭灶供灶糖的原因,是为了粘住灶爷的嘴巴。

  • 什么是不可导点(什么是不可导点,一般在哪里取得不可导点)

    如果函数不连续,那么那个地方就是不可导的,因为本身就不在函数的定义域内。函数可导的充要条件:函数在该点连续且左导数、右导数都存在并相等。

  • 云南旅游自驾路线推荐(自驾游路线推荐)

    路线昆明—大理—保山—龙陵—瑞丽—腾冲—昆明。里程大约1700公里。日程安排第一天昆明—大理交通:G56高速公路,昆明西站至大理古城约330公里。如果时间充裕,抵达大栗树村时,可往北行驶25公里,至宝丰乡游览,此处有两座异地保存的滇缅公路铁桥。第四天:保山—龙陵交通:保山到龙陵,滇缅公路与国道320线相距较远。这段滇缅公路保存很好,沿途风景优美,路面安静,非常适合自驾游。

  • a型血的爱情分析(心理学研究A型血的人)

    以下内容大家不妨参考一二希望能帮到您!a型血的爱情分析提到一个人的性格,大家首先会想到的是内向性格、外向性格这类描述。但是,心理学家对于性格的分类远远没有那么狭隘,还有很多性格分类是细化而精确的,比如,按照和外界的交流方式还可以分为:讨好型性格、容纳型等等。问题是,性格是如何形成的呢?

  • 种翡翠手镯(翡翠手镯种水有什么特性)

    “种水”的说法虽然耳熟能详,但实际上最初是由玉雕工匠对翡翠特性的简单划分,而后代代相传,于是具有了现如今的统一说法。影响“种水”的因素,因透明度和结构是来决定“种水”优劣的关键,那么对翡翠的研究,基本上留心翡翠组成矿物之间的彼此关系。另外,值得注意的是,所指的“种水”比较,一定要建立在一致的厚度的基础上,因商家会依照做薄翡翠来提升通透,购置翡翠的时期,一定要时刻警惕。

  • 男的穿越古代嫁给王爷小说(小说老太错嫁王爷)

    明侨恨啊,人不为己天诛地灭,当然是谁的大腿好抱就抱谁的了,这个系统居然敢限制她!正堂在她的心目中,其实就是公堂,审犯人的地方。可这宁王的大腿不好抱啊,总有很多人来把她拉走,能决定她留在王府的,她怕这次已经不是由宁王做主,而是宁意亭了。明侨觉得宁意亭若是这么一做,倒是成了无情无义之人,活生生的拆了他们夫妻。李汐月不管是相貌还是家世,都比她这个老太婆好,反正娶来都不睡,她相信宁风倾会低头选李汐月。

  • 芋头开花怎么回事(芋头开花结果吗)

    2、激素作用:人们在栽培芋头过程中,有意或无意加入一些生长激素,加上高温天气作用,也会促进芋头开花。

  • 小米蓝牙耳机青春版和普通版区别(小米蓝牙耳机和小米蓝牙耳机青春版的区别)

    小米蓝牙耳机青春版和普通版区别如下:1、这两款耳机上市的时间不一样,常规版的很早就上市了,在官网已经买不到了,青春版是后上市的,现在官网上还有售卖。目前的小米蓝牙耳机支持所有配备蓝牙功能的智能手机,这个当然也包含了苹果手机,所以小米蓝牙耳机能够连接苹果手机。不仅如此,小米蓝牙耳机还能兼容苹果手机中的Siri智能语音功能,而且兼容性非常好。

  • 机票就是登机牌吗(机票是不是登机牌)

    我们一起去了解并探讨一下这个问题吧!机票是购买该航班的凭证,跟汽车票、火车票类似,而乘坐飞机是需要办理登机手续的,登机牌就是办理登机、办理行李托运等的凭证,过安检也需要用到,是可以顺利登机的保证。机票的预订方式可以有很多种,在各大网站、机场都可以预订,但是登机牌只能到机场办理。

  • ipad的基本用途(iPad不仅仅是娱乐平板)

    近日,苹果在YouTube上分享了一些新的iPadPro教程视频,苹果总是很喜欢发布一些自家产品的操作视频,不过看完之后什么都没学会,只有一个深刻的感受,我买的是假的iPadPro吗?为什么我的iPadPro只能用来看电视?苹果分享的iPadPro的教程视频中,有关于制作音乐和剪辑视频的,还可以用来计划婚礼和旅行。如果你拥有一个iPadPro和ApplePencil,你平时都用它做什么?