北京,2023年4月14日/美通社/——全球领先的全息增强现实(AR)技术提供商WiMi全息云股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布,其研发团队正在研究基于多通道卷积神经网络的3D物体检测算法。它使用RGB、深度和BEV图像作为网络的输入,分别回归对象的类别、3D大小和空间位置。该算法结合了多通道神经网络系统来实现三维目标检测。
BEV图像提供垂直于相机视点的信息,并且可以表示对象的空间分布。BEV图像使用点云投影生成,并用作神经网络输入,以提高3D对象检测精度。通过CNN直接处理输入的点云数据,可以解决无序点云的编码和特征提取问题,获得3D边界盒的端到端回归。该算法仅从单眼图像中提取3D建议帧,并估计3D边界框,然后将激光点云与视觉信息相结合,并将点云投影到BEV图像中。该算法将信息馈送到CNN中,并融合多条信息以估计3D边界框。多个信息的融合有助于更好地检测3D空间中的对象。
WiMi的3D物体检测算法可以同时识别物体的类别、空间位置和3D尺寸,极大地提高了物体检测的准确性和效率。多通道物体检测神经网络系统允许3D物体检测,将输入扩展到RGB、深度和BEV图像。首先,使用RGB图像、深度图像和BEV图像作为网络输入,然后通过CNN获得特征图。使用空间金字塔池化层生成特征图中所提出区域的特征向量,然后使用分类器和回归器实现对象的分类和位置回归。分类器主要用于确定提案中提取的特征属于哪一类。最后,将通过两个完全连接的层进行多任务回归,以预测对象类和3D边界框。
三维物体检测和识别一直是计算机视觉中的关键技术。它是机器理解和与外部世界互动的基础。三维物体检测技术可广泛应用于导航、智能机器人、无人驾驶汽车和安全监控等领域。
随着三维数据采集技术的进步、计算能力的增强、深度学习以及应用需求的增加,三维视觉技术的研究和应用越来越受到重视。WiMi的算法在自动驾驶、智能机器人、ARVR、遥感、生物医学等领域具有广阔的应用前景。
关于WIMI全息云
WIMI全息云公司(NASDAQ:WIMI)是一家全息云综合技术解决方案提供商,专注于包括全息AR汽车HUD软件、3D全息脉冲激光雷达、头戴式光场全息设备、全息半导体、全息云软件、全息汽车导航等专业领域。其服务和全息AR技术包括全息AR汽车应用、3D全息脉冲激光雷达技术、全息视觉半导体技术、全息软件开发、全息AR广告技术、全息AR娱乐技术、全息ARSDK支付、交互式全息通信和其他全息AR技术。