新芒X 11月23日消息 近日Nvidia推出了GauGAN2,用于从简单的短语生成逼真的图像。作为深度学习模型GauGAN的后继者,绘画 AI 只需输入几个词即可生成逼真的场景,并在添加新形容词时修改图像。

英伟达的第一个 GauGAN 系统以后印象派画家保罗·高更的名字命名,在接受了超过 100 万张公共 Flickr 图像的训练后于 2019 年发布。它被用来创建 Nvidia 的快速绘画 Canvas 应用程序,该应用程序现在处于测试阶段。
GauGAN2 也是一个基于 GAN 的系统,在 1000 万张图像上进行了训练。它结合了“在单个模型中的分割映射、修复和文本到图像的生成”。
用户输入一个简短的短语,例如“白雪皑皑的山脉”,它就会生成图像。然后,用户可以创建概述对象位置的分割图,并使用他们自己的粗略草图调整场景。
据公司博客文章称,与其他最先进的模型相比,GauGAN2 的神经网络可生成“种类更多、质量更高的图像”。GauGAN2 现在可以在 Nvidia 的AI Demos网站上找到。