北京,2023年8月16日/PRNewswire/-全球领先的全息增强现实(“AR”)技术提供商WiMi全息云股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布,开发了一种基于卷积神经网络(CNN)的具有良好表征能力的3D人类行为识别算法系统。
人类行为识别(HBR)是通过复杂的技术破译人类行为的过程,目的是使机器能够理解、分析、理解和分类这些行为,并提供任何有效的输入或刺激。深度学习在解决识别和分类问题方面非常有效,因为它可以进行端到端优化,相关任务可以相互受益(迁移学习)。
首先,从骨骼关节的相对运动中提取四个独特的时空特征向量,随后将其编码为图像,然后将其输入CNN进行深度特征提取。更具体地说,该系统通过从3D骨架数据中提取四种类型的信息特征(距离、距离-速度、角度和角度-速度特征)并使用合适的编码方案将它们编码成图像,来将数据用于3D人类行为识别任务。此外,WiMi使用反离子优化来从特征空间中去除冗余和误导性信息。最后,WiMi使用分类来进行操作的最终预测。
该系统的应用过程主要包括数据采集、数据预处理、特征提取、分类和预测决策。
第一步是为基于CNN的3D HBR系统收集适当的数据。一个合适的、结构化的和正确标记的数据集是训练模型的最基本要求之一。神经网络将以数据集为例学习其相应的特征信息,保存深度神经网络训练的内存,并将该内存作为预测其他相应数据集的基础。因此,数据集的质量将直接影响神经网络训练的质量。在覆盖范围广、信息全、分辨率高的数据集上训练的神经网络远优于在复杂背景的简单、低分辨率数据集上培训的网络。人类行为识别网络对数据集的要求包括全面的行为类别、高质量的行为、清晰的视频等。第二步是数据预处理,将特征转换、特征选择和特征提取耦合在一起,通常称为数据预处理模块。特征提取和正确表示是提高模型性能的关键步骤。对于高维数据,模型过拟合的可能性相对增加,因此需要选择相关特征。为分类模型选择所需的特征是使其正确的关键步骤。下一步是分类,提取的特征用于训练模型,用于识别和分类不同形式的人类行为。最后,还有预测分析,从卷积神经网络模型的输入中提取更多信息特征,以便模型可以在不考虑类别之间视觉差异的情况下做出决策。
WiMi基于CNN技术的3D HBR算法系统可以实现对个人和群体的高精度行为识别,设置异常行为预测和及时预警,可广泛应用于人员识别、车辆识别、区域入侵、目标异常检测等应用场景。
关于WIMI全息云
维密全息云股份有限公司(NASDAQ:WIMI)是一家全息云综合技术解决方案提供商,专注于全息AR汽车HUD软件、3D全息脉冲激光雷达、头戴光场全息设备、全息半导体、全息云软件、全息汽车导航等专业领域。其服务和全息AR技术包括全息AR汽车应用、3D全息脉冲激光雷达技术、全息视觉半导体技术、全息软件开发、全息AR广告技术、全息AR娱乐技术、全息ARSDK支付、交互式全息通信和其他全息AR技术。