Adobe 把 GAN 搞成了缝合怪，凭空 P 出一张 1024 分辨率全身人像

换脸见多了，换身材的见过吗？给定一张脸，就能自动换一个下半身，服饰、身材、肤色都毫无 PS 痕迹：核心技术当然还是我们熟悉的 GAN，但不同的是，现在身体的每个部分都能被 PS 了。从脸，肤色、服饰、头发等身体各个部位，甚至到肢体动作，都能被随意设计和组合，最终“缝”成一张 1024 × 1024 分辨率的全身照片：而且这张“缝合怪”还完全没有拼接行为带来的阴影和边界：▲ 上方的面部由新方法生成，阴影边界很少怎么做到的？把用于生成人体不同部位的 GAN“拼”起来。这就是 Adobe 团队最新提出的一种结合多个预训练的 GAN 进行图像生成的新方法，论文目前已被 CVPR 2022 接收：接下来就一起来看看他们到底是如何实现的。用 PS 的方式 GAN 出个人体如我们开头所说，这是一种将多个 GAN 拼接起来使用的方法，研究团队将其称之为 InsetGAN。共分为两类 GAN：全身 GAN （Full-Body GAN），基于中等质量的数据进行训练并生成一个人体。部分 GAN，其中包含了多个针对脸部、手、脚等特定部位进行训练的 GAN。这两类 GAN 的合作方式类似于 PS：全身 GAN 是一张已经有打底线稿的画布，而部分 GAN 则是一张一张叠在上面的图层。但不同边界的“图层”在叠到画布上时，一定会有出现对齐问题。比如，将一张脸添加到身体上时，在肤色的一致性、衣服边界和头发披散的自然性上可能出现细节的扭曲和丢失，或出现伪影（Artifacts）：如何才能更好地协调多个 GAN，让它们产生一致的像素呢？研究团队设计了这样一种架构：他们首先引入了一个边界框检测器，检测部分 GAN 生成的特定区域在底层画布，也就是全身 GAN 生成的区域中的位置，经过裁剪后再将特定区域嵌入。这一过程相当于找到了两个区域之间的一种随机潜码（latent code），使得所选区域的边界能够和嵌入区域相匹配，以实现无缝合成。同时，他们还会对这两个区域进行下采样（Downsample），再次增加图像像素内容的一致性。基于这种方法，InsetGAN 可以在训练后生成多张完整人像，同时肤色、头发和相关姿势都能作出相应调整：研究团队也与之前的生成全身人像的方法 CoModGAN 做了比较，都是基于左侧的人体进行面部的替换，显然，InsetGAN 生成的面部更加自然：▲ 上为 InsetGAN，下为 CoModGAN作者介绍论文共有 6 位作者，5 位来自 Adobe 研究院，还有 1 位来自阿卜杜拉国王科技大学（KAUST）。其中有 Adobe 的首席科学家 Jingwan Lu，是 PS 2020 中智能肖像、皮肤平滑、着色和神经风格化等过滤器的主要算法贡献者，也是 RealBrush 笔刷合成器的开发者。她目前领导的团队主要致力于利用大数据和生成性 AI（比如 GAN）来进行视觉内容的创造。所以，准备好足不出户换身材了吗？（手动狗头）论文地址：https://arxiv.org/abs/2203.07293参考链接：[1]https://www.youtube.com/watch?v=YKFYEt5hvOo[2]http://afruehstueck.github.io/insetgan/

3399IT网

Adobe 把 GAN 搞成了缝合怪，凭空 P 出一张 1024 分辨率全身人像

作者: 博雯

作者: 博雯

为您推荐

曾学忠：小米手环销量累计达 1.4 亿只，小米手环 7 是“有史以来最强的小米手环”

再秀肌肉？特斯拉第二届 AI 日活动确认将于 8 月 19 日举行

众筹价 699 元，小米推出米家智能 IH 多功能料理锅：支持煎烤蒸煮焖炒，可 OTA 一键升级

小度发布添添智能健身镜：能捕捉 19 个人体关键骨骼点，4199 元起

小度智能摄像头电视 V75 发布：4K 分辨率，支持杜比视界，5699 元

5 笔涂出一只 3D 猫咪模型：可跑可跳无需手动绑定骨骼，浙大出品，代码已开源