北京,2023年4月13日/美通社/——全球领先的全息增强现实(AR)技术提供商WiMi全息云股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布开发基于多视图特征融合的3D物体识别系统。该系统使用卷积神经网络来分析3D对象的不同视点,并融合来自多个视点的特征,以推断关于3D对象的全局信息,这些信息被馈送到全连接网络中,用于从多个视点分类和推断3D对象的标签。
WiMi基于多视角特征融合的三维物体识别系统由三个主要部分组成:视点信息选择、特征提取和特征融合。
视点信息模块可以从多个视点将3D对象投影到2D平面中。不同的视点涉及不同的对象方向和结构信息。可以在多个视图之间构建图结构,并基于空间分布将其聚类为组。合理的视点信息选择策略可以优化网络的训练数据。
特征提取模块是使用卷积神经网络来提取特征。在卷积层之后,特征映射模块可以作用于视图特征响应图。使用多层感知机学习多个映射矩阵,并且多个矩阵将相应的视图映射到近似特征空间上。映射矩阵可以概括视图之间的视点变换关系,并将特征图映射到描述区域的组级特征。
特征融合模块侧重于以合理有效的策略融合多个特征,以实现基于聚类的多层融合。卷积运算对高维视图特征进行加权,并对不同视图之间的权重信息进行编码。CNN处理具有空间数据的特征响应图。在使用最大值池化以获得特征图上的最大响应之后,从CNN的卷积层提取特征。该系统学习相邻视图之间的相关性,以生成更具解释力的全局特征,并将其融合到特征图中。
将所有视图特征融合为全局特征后,系统将全局特征输入到全连通层,利用空间信息挖掘融合特征中的高维特征,完成分类和输出结果。
三维物体识别技术是计算机视觉的核心技术之一,也是理解三维场景的关键技术。WiMi将继续扩展其基于多视图特征融合的3D对象识别算法的应用。
关于WIMI全息云
WIMI全息云公司(NASDAQ:WIMI)是一家全息云综合技术解决方案提供商,专注于包括全息AR汽车HUD软件、3D全息脉冲激光雷达、头戴式光场全息设备、全息半导体、全息云软件、全息汽车导航等专业领域。其服务和全息AR技术包括全息AR汽车应用、3D全息脉冲激光雷达技术、全息视觉半导体技术、全息软件开发、全息AR广告技术、全息AR娱乐技术、全息ARSDK支付、交互式全息通信和其他全息AR技术。