北京,2023年8月21日/PRNewswire/-全球领先的全息增强现实(“AR”)技术提供商WiMi全息云股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”)今天宣布,已开发出一种基于连续多尺度特征学习系统模型网络的新型图像分类系统,该系统使用精心设计的预处理和建模架构。与现有方法相比,该模型受益于多尺度特征提取和连续特征学习,并通过使用具有不同感知的各种特征图在速度和准确性方面实现了更好的性能。
WiMi的连续多尺度特征学习系统模型网络采用了一种基于使用具有不同感受野的各种特征图的连续特征学习方法,以实现更快的训练/推理和更高的精度。系统网络包含三个重要步骤,即数据预处理、数据学习和推理。在数据预处理阶段,数据集图像被表示为张量,这使得训练过程中的计算更容易、更高效。在数据学习阶段,使用基于连续多尺度特征学习的模型提取图像的有用特征。在推理阶段,在完成所提出的系统的第二步并获得训练后的模型后,可以使用该模型对图像进行分类。
在数据预处理阶段,数据集图像被表示为张量,用于后续的计算和处理。这使得训练期间的计算更加容易和高效。预处理过程包括图像的归一化、缩放和裁剪。这一步骤的目的是使数据在训练过程中更加方便和高效,并提高后续处理的准确性和可靠性。这个过程是为了确保输入数据得到正确处理,并且可以被模型正确识别和学习。
在数据学习阶段,WiMi的网络系统使用连续的多尺度特征学习方法从图像中提取有用的特征。该方法的基本思想是将图像分解为不同的尺度,然后在每个尺度上提取相应的特征。不同尺度的图像信息包含不同的特征信息,例如,在低分辨率图像中,细节信息被模糊,但图像的全局信息和轮廓信息仍然被很好地保留。因此,多尺度特征提取可以提高模型的鲁棒性和泛化能力。
具体而言,网络架构由一系列特征提取模块和特征融合模块组成。特征提取模块采用一系列卷积层、池化层和激活函数来提取不同尺度的特征图。特征融合模块用于融合不同尺度的特征图,以获得更全面、更具代表性的特征表示。特征融合模块采用了一种特殊的方法,将不同尺度的特征图连接起来,然后通过一些卷积层和激活函数对特征进行融合。该方法的优点是可以避免信息丢失,并且可以充分利用不同尺度的特征信息。
在推断阶段,WiMi可以使用经过训练的模型对新图像进行分类。具体来说,我们将测试图像输入到模型中,然后根据模型输出的预测结果确定图像的类别。为了提高模型的准确性和泛化能力,我们可以在测试阶段对输入图像进行数据增强操作,如随机旋转、裁剪和翻转,以模拟更多的图像变化。在这一步中,我们可以使用不同的技术和算法来优化模型的准确性和效率。例如,我们可以使用卷积神经网络(CNN)从图像中提取特征,或者使用递归神经网络(RNN)处理序列数据。