WiMi（WiMi.US）将致力于基于多通道CNN的3D对象检测算法_公司

北京，2023年4月14日/美通社/——全球领先的全息增强现实（AR）技术提供商WiMi全息云股份有限公司（NASDAQ:WiMi）（“WiMi”或“公司”）今天宣布，其研发团队正在研究基于多通道卷积神经网络的3D物体检测算法。它使用RGB、深度和BEV图像作为网络的输入，分别回归对象的类别、3D大小和空间位置。该算法结合了多通道神经网络系统来实现三维目标检测。

BEV图像提供垂直于相机视点的信息，并且可以表示对象的空间分布。BEV图像使用点云投影生成，并用作神经网络输入，以提高3D对象检测精度。通过CNN直接处理输入的点云数据，可以解决无序点云的编码和特征提取问题，获得3D边界盒的端到端回归。该算法仅从单眼图像中提取3D建议帧，并估计3D边界框，然后将激光点云与视觉信息相结合，并将点云投影到BEV图像中。该算法将信息馈送到CNN中，并融合多条信息以估计3D边界框。多个信息的融合有助于更好地检测3D空间中的对象。

WiMi的3D物体检测算法可以同时识别物体的类别、空间位置和3D尺寸，极大地提高了物体检测的准确性和效率。多通道物体检测神经网络系统允许3D物体检测，将输入扩展到RGB、深度和BEV图像。首先，使用RGB图像、深度图像和BEV图像作为网络输入，然后通过CNN获得特征图。使用空间金字塔池化层生成特征图中所提出区域的特征向量，然后使用分类器和回归器实现对象的分类和位置回归。分类器主要用于确定提案中提取的特征属于哪一类。最后，将通过两个完全连接的层进行多任务回归，以预测对象类和3D边界框。

三维物体检测和识别一直是计算机视觉中的关键技术。它是机器理解和与外部世界互动的基础。三维物体检测技术可广泛应用于导航、智能机器人、无人驾驶汽车和安全监控等领域。

随着三维数据采集技术的进步、计算能力的增强、深度学习以及应用需求的增加，三维视觉技术的研究和应用越来越受到重视。WiMi的算法在自动驾驶、智能机器人、ARVR、遥感、生物医学等领域具有广阔的应用前景。

关于WIMI全息云

WIMI全息云公司（NASDAQ:WIMI）是一家全息云综合技术解决方案提供商，专注于包括全息AR汽车HUD软件、3D全息脉冲激光雷达、头戴式光场全息设备、全息半导体、全息云软件、全息汽车导航等专业领域。其服务和全息AR技术包括全息AR汽车应用、3D全息脉冲激光雷达技术、全息视觉半导体技术、全息软件开发、全息AR广告技术、全息AR娱乐技术、全息ARSDK支付、交互式全息通信和其他全息AR技术。

简 繁

WiMi（WiMi.US）将致力于基于多通道CNN的3D对象检测算法

简

繁