北京,2023年8月18日/PRNewswire/-全球领先的全息增强现实(“AR”)技术提供商WiMi全息云股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”),今天宣布,它开发了一种基于Mask R-CNN的技术,用于智能提取CSO(特征空间对象)及其参考点,在高分辨率图像处理和匹配领域取得了突破。该技术利用深度学习和计算机视觉的最新进展,为自动图像匹配和目标定位提供了高效准确的解决方案。
高分辨率图像处理和匹配一直是计算机视觉领域的一个重要研究方向,但由于图像的局部变形和光照条件的差异,自动匹配一直面临着巨大的挑战。以前的方法往往受到计算复杂性和对局部特征依赖性的限制,难以获得准确的结果。WiMi的技术可用于提取图像上的CSO及其参考点。利用这种方法,可以自动获取CSO,并为后续的图像匹配过程提供准确的定位信息。
WiMi的研发团队通过引入Mask R-CNN模型成功解决了这一挑战,这是一种基于Faster R-CNN的模型扩展,通常用于目标检测和实例分割。该模型的独特之处在于,它可以同时预测目标的边界框、类别、掩码和关键点,为图像处理任务提供全面的信息。
在这项新技术中,WiMi首先利用大量高分辨率遥感图像数据来训练Mask R-CNN模型。通过训练,该模型能够学习图像中不同目标实例的特征,并准确预测其边界框、类别、掩码和关键点。在训练的Mask R-CNN模型的基础上,技术团队进一步提出了CSO的概念和参考点法。CSO是指具有显著特征的目标实例,可以通过设置阈值或规则来智能过滤掉。另一方面,通过掩码预测器和关键点预测器从CSO中提取参考点,用于定位目标实例的重要特征点。
其技术实现逻辑如下:
数据准备:首先,需要准备一个用于训练和评估的高分辨率遥感图像数据集。数据集应包含具有不同目标类型和变形级别的图像。
模型训练:使用准备好的数据集训练Mask R-CNN模型。训练的目标是使模型能够准确预测目标的边界框、类别、掩码和关键点。
CSO参考点提取:在经过训练的Mask R-CNN模型上,通过输入高分辨率遥感图像,可以实现CSO和参考点的智能提取。CSO的定义:CSO是指特征空间对象,即具有鲜明特征的目标实例。通过设置一些阈值或规则,可以将具有显著特征的目标实例筛选为CSO。参考点提取:利用mask R-CNN模型的掩码预测器和关键点预测器提取每个CSO的掩码和关键点。掩码预测器将为每个CSO生成一个二进制掩码,用于准确分割目标实例。关键点预测器将预测目标实例的关键点坐标,用于定位目标实例的重要特征点。
CSO和参考点的应用:提取的CSO和基准点可用于多种应用,如高分辨率遥感图像匹配。根据具体的应用场景,可以根据CSO的位置和特征来实现图像匹配或其他相关任务。
该技术的突破在于,它不仅有效地提取了CSO和参考点,而且准确地描述了目标实例的形状和位置。这使得高分辨率图像的自动匹配更加准确可靠,为后续的图像处理任务提供了可靠的基础。