按关键词检索

微信服务号

微信订阅号

2025年3月29日 16:14 星期六

查询高级检索+

共找到相关记录1条

全选

显示方式：|

基于多域VQGAN的文本生成国画方法研究
孙泽龙，杨国兴，温静远，费楠益，卢志武，文继荣
2023, 34(5):2116-2133.DOI: 10.13328/j.cnki.jos.006769
关键词：文本生成图像; 多域生成; 中国画生成
摘要 (1213)HTML (2755)PDF 16.68 M (5215)收藏
摘要:随着生成式对抗网络的出现，从文本描述合成图像最近成为一个活跃的研究领域.然而，目前文本描述往往使用英文，生成的对象也大多是人脸和花鸟等，专门针对中文和中国画的研究较少.同时，文本生成图像任务往往需要大量标注好的图像文本对，制作数据集的代价昂贵.随着多模态预训练的出现与推进，使得能够以一种优化的方式来指导生成对抗网络的生成过程，大大减少了对数据集和计算资源的需求.提出一种多域VQGAN模型来同时生成多种域的中国画，并利用多模态预训练模型WenLan来计算生成图像和文本描述之间的距离损失，通过优化输入多域VQGAN的隐空间变量来达到图片与文本语义一致的效果.对模型进行了消融实验，详细比较了不同结构的多域VQGAN的FID及R-precisoin指标，并进行了用户调查研究.结果表示，使用完整的多域VQGAN模型在图像质量和文本图像语义一致性上均超过原VQGAN模型的生成结果.

上一页 1 下一页

共1页1条记录跳转到页GO

出版年份

2023年1

您是第19749870位访问者
版权所有：中国科学院软件研究所京ICP备05046678号-3
地址：北京市海淀区中关村南四街4号,邮政编码：100190
电话：010-62562563 传真：010-62562533 Email：jos@iscas.ac.cn
技术支持：北京勤云科技发展有限公司

京公网安备 11040202500063号