昇思25天学习打卡营第23天|应用实践之CycleGAN图像风格迁移互换_业界新闻

发布时间:2024-07-17 23:00

阅读量:1

基本介绍

从今日开始，要今日应用实践中的生成式模型，将会实践体验用生成式模型进行诸如风格迁移的有趣的应用。今日要实践的模型是CycleGAN，用于图像风格迁移。使用的数据集里面的图片来源于ImageNet，该数据集共有17个数据包，本文只使用了其中的苹果橘子部分。图像被统一缩放为256×256像素大小，其中用于训练的苹果图片996张、橘子图片1020张，用于测试的苹果图片266张、橘子图片248张。本文会先简单介绍CycleGAN模型，然后展示自己的运行结果，不作代码展示，最后进行总结。

CycleGAN模型简介

CycleGAN(Cycle Generative Adversarial Network) 即循环对抗生成网络，来自论文 Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks 。该模型实现了一种在没有配对示例的情况下学习将图像从源域 X 转换到目标域 Y 的方法。

CycleGAN 网络本质上是由两个镜像对称的 GAN 网络组成，其结构如下图所示（图片来源于原论文）：

为了方便理解，这里以苹果和橘子为例介绍。上图中 𝑋 可以理解为苹果，𝑌为橘子；𝐺 为将苹果生成橘子风格的生成器，𝐹为将橘子生成的苹果风格的生成器，𝐷𝑋 和 𝐷𝑌为其相应判别器。模型最终能够输出两个模型的权重，分别将两种图像的风格进行彼此迁移，生成新的图像。该模型一个很重要的部分就是损失函数，在所有损失里面循环一致损失(Cycle Consistency Loss)是最重要的。循环损失的计算过程如下图所示（图片来源于原论文）：