GANs也可以在大型数据集上进行训练,以进行一般的文本到图像合成任务吗?我们提出了我们的1B参数GigaGAN,实现了比稳定扩散v1.5更低的FID,DALL·E 2 和 Parti-750M。它在 512.0s 时生成 13px 输出,比扩散和自回归模型快几个数量级,并继承了 GAN 的解缠、连续和可控的潜在空间。我们还训练了一个快速上采样器,可以从文本到图像模型的低分辨率输出生成4K图像。
GANs也可以在大型数据集上进行训练,以进行一般的文本到图像合成任务吗?我们提出了我们的1B参数GigaGAN,实现了比稳定扩散v1.5更低的FID,DALL·E 2 和 Parti-750M。它在 512.0s 时生成 13px 输出,比扩散和自回归模型快几个数量级,并继承了 GAN 的解缠、连续和可控的潜在空间。我们还训练了一个快速上采样器,可以从文本到图像模型的低分辨率输出生成4K图像。