基于文本语义驱动的遥感影像要素提取 |
| |
作者姓名: | 董思俊 孟小亮 |
| |
作者单位: | 武汉大学遥感信息工程学院,武汉 430000 |
| |
基金项目: | 国家自然科学基金 ( 41971352 ) |
| |
摘 要: | 随着遥感技术的快速发展,高精度的遥感影像要素提取在地理信息科学、城市规划和环境监测等领域变得尤为重要.然而,传统基于图像的遥感影像要素提取方法在面对复杂和多变的地表特征时,往往精度有限,难以适应多样化的应用需求.为了解决这一问题,文章提出了一种新型的基于图像和文本的多模态遥感影像语义分割框架(MMRSSEG).该框架通过综合运用视觉和文本信息,利用深度学习技术,实现对遥感影像的高精度解析.经过在遥感影像建筑物数据集上进行的一系列实验,实验结果表明:与传统的图像分割方法相比,MMRSSEG能显著提高像素级遥感影像要素提取的准确性.在建筑物识别任务中,该方法比传统的单模态算法取得了更好的效果.实验结果充分证明了结合多模态的文本信息在遥感影像分割中的有效性和应用前景.
|
本文献已被 万方数据 等数据库收录! |
|