当前热文:热消息:GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型
财金网
2023-06-17 06:52:51
<script type="text/javascript" src="http://www.beijingleather.com.cn/static/js/swfobject.js"></script> <script type="text/javascript" src="http://www.beijingleather.com.cn/static/js/action.js"></script> GigaGAN 改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition): GigaGAN 在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s): GigaGAN 除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示: 更多效果图和技术细节见论文 https://arxiv.org/abs/2303.05511和网站 https://mingukkang.github.io/GigaGAN/
(资料图片)
点蓝色字关注“机器学习算法工程师”
设为星标,干货直达!