品玩8月25日讯,据 Arxiv 页面显示,中国科学技术大学近日联手新加坡管理大学发布一款图像生成模型 CgT-Gan。
CgT-GAN通过将图像纳入训练过程,使模型能够“看到”真实的视觉模态。具体来说,研究团队采用对抗训练来教导CgT-GAN模型模仿外部文本语料库的短语,同时利用基于CLIP的奖励机制提供语义指导。
实验结果显示,CgT-GAN在所有指标上明显优于现有的方法。
关键词: