北京,2023年6月9日/美通社/–WiMi全息云股份有限公司(NASDAQ:WiMi)(“WiMi”或“公司”),全球领先的全息增强现实(“AR”)技术提供商,今天宣布通过深度学习和神经网络技术为计算机生成全息(CGH)提供一种新的更高效的解决方案。深度学习可以在运算中找到最优或局部最优解,从而提高计算CGH的效率。CGH已被应用于全息光阱、3D显示器、平面聚光器、AR显示器等。
CGH技术可以通过对自定义光场进行逆求解来获得最佳的波调制。SLM调制的精度限制了图像质量,而SLM调制通常难以表示目标光场。在实践中,计算全息图的解总是近似的,需要用数值方法来确定可行的全息图,以获得最佳的编码波前。目前CGH中的计算通常使用迭代算法,而非迭代方法是通过进化GS算法来节省计算时间的。尽管有所改进,但由于散射噪声、下采样效应和共轭图像干扰,这些非迭代方法在重建过程中总是导致图像质量差和空间分辨率低。在使用深度学习技术时,U-net结构已经在CGH问题上进行了尝试,并取得了初步成功,但U-net在计算全息问题中获得的全息图存在降低重建图像质量的缺点。传统的卷积神经网络依赖于卷积滤波器和非线性激活函数,这意味着处理后的数据被假设为线性可分离的。然而,图像编码、全息加密和频率分析等问题很难用线性可分函数来描述,并且简单的卷积和去卷积总是被限制在某个区域,以提高运算效率。U-net不能利用和重写全局信息意味着光学图像处理非常薄弱。
WiMi开发了高效的计算机生成全息术(ECGH)技术,这是一种基于深度学习的CGH成像方法,旨在解决传统CGH方法计算周期长、质量差的问题。该方法使用混合线性卷积神经网络(MLCNN)进行计算全息成像,并通过在网络中引入全连接层来增强信息挖掘和信息交换。
该网络使用具有线叉层的MLCNN结构、用于下采样的“DownSample”结构和用于上采样的“UpSample”结构。该技术使用神经网络模型来计算输入目标光场,并计算相位值来模拟光学实验结果。使用损耗函数将目标光场与模拟结果进行比较,并计算损耗值的梯度并反向传播以更新网络参数。
WiMi的ECGH方法可以快速获得所需的纯相位图像,以生成高质量的全息成像。与传统的基于深度学习的CGH方法相比,WiMi的ECGH技术可以将网络训练所需的参数数量减少约60%,从而提高网络的效率和可靠性。此外,ECGH技术的网络结构通用性强,可用于解决各种图像重建问题,具有较强的实用性和应用前景。
WiMi的ECGH图像使用非迭代深度学习模型MLCNN,可以更快地计算全息图生成。通过成功地应用ECGH方法,可以获得高质量、稳定的计算全息图像。MLCNN结构的一个主要特征是能够计算数据的跨区域交换,这使得它适用于需要操纵全局信息的复杂光学函数。在WiMi的ECGH技术中应用MLCNN模型可以有效地处理光学功能的复杂性。该模型可以处理各种复杂的光学功能,以生成高质量的全息图像。这种全息图像可以完美再现3D场景,给观察者更逼真的视觉体验。MLCNN模型比U-net网络结构具有更好的光域自适应性。这使其在全息生成和重建方面具有优势,因为它可以更好地处理光学功能的复杂性和光学域中的变化,并且CGH可以完美地再现3D场景的能力并防止视觉疲劳。