双重模态文本引导的图像修复算法 |
| |
作者姓名: | 李海燕 陈杰 余鹏飞 李海江 张榆锋 |
| |
作者单位: | 1. 云南大学信息学院;2. 云南省交通投资建设集团有限公司 |
| |
基金项目: | 国家自然科学基金(62266049,62066046); |
| |
摘 要: | 为解决现有图像修复算法因缺乏足够的上下文信息导致修复大面积破损时效果差且修复结果不可控的缺陷,提出了双重模态文本引导的图像修复算法。引入文本标签作为修复的控制引导,确保修复结果的整体与区域一致,并增加修复的可控多样性。设计双重模态掩码注意力机制提取破损区域的语义信息;通过深度文本图像融合模块加深生成器中的文本图像融合过程,并应用图像文本匹配损失最大化生成图像与文本之间的语义相似度;采用投射鉴别器训练生成图像与真实图像增强修复图像的真实性。在2个带有文本标签的数据集上进行定量和定性实验,结果表明:生成的修复图像与引导文本描述一致,可根据不同的文字描述生成多样的结果。
|
关 键 词: | 图像修复 文本引导 注意力机制 文本图像融合 图像文本匹配损失 |
|
|