用于电影和电视视觉内容展示的混合场景全息3D显示屏：零阶抑制单全息图融合与保留视差的数字缩放黄鹏飞、王涛

《Photonics》：Mixed-Scene Holographic 3D Display for Film and Television Visual Content Presentation: Zero-Order-Suppressed Single-Hologram Fusion and Parallax-Preserving Digital Resizing Pengfei Huang and Tao Wang

【字体：大中小】 时间：2026年04月28日 来源：Photonics 1.9

编辑推荐：

　　摘要：混合场景全息3D显示器在电影和电视视觉内容呈现方面仍然面临挑战，因为录制的数字全息图和计算机生成的全息图（CGHs）是在不同的数值和硬件限制下产生的。直接全息图叠加通常会导致强烈的零阶干涉、衍射效率下降以及记录传感器与重放面板之间的采样间距不匹配，而传统的尺寸调整会减小有效

　　摘要：混合场景全息3D显示器在电影和电视视觉内容呈现方面仍然面临挑战，因为录制的数字全息图和计算机生成的全息图（CGHs）是在不同的数值和硬件限制下产生的。直接全息图叠加通常会导致强烈的零阶干涉、衍射效率下降以及记录传感器与重放面板之间的采样间距不匹配，而传统的尺寸调整会减小有效的重放孔径并限制可用的视差范围。为了解决这些问题，本文提出了一种抑制零阶成分的单全息图融合框架，并结合了保持视差的数字尺寸调整技术。首先对录制的数字全息图进行高斯高通滤波以抑制主要的零阶成分，然后重新采样以匹配LCOS重放的采样间距，最后进行归一化处理并与通过双极强度编码生成的CGH融合。在此基础上，开发了两种尺寸调整方法：一种是用于保持孔径的空间域全场景缩放方法，另一种是用于选择性对象缩放和平移的频域方法。在三通道LCOS原型上的光学验证表明，对于双全息图融合的情况，定量衍射效率分析预测每个重建对象的效果从大约10.1%提高到20.05%，修正后的实验结果与这一改进趋势一致。实验还验证了多倍缩放下的重放效果、物理对象与虚拟对象的选择性操作、混合场景的颜色重放以及遮挡一致的深度排序。结合畸变分析，这些结果表明，融合后重放的可见性得到了提升，同时保持了几何可控性和有效的重放孔径。通过依赖于全息图域的预处理和尺寸调整，而不是完全重新计算混合场景，所提出的方法还减轻了计算负担。因此，该方法为视觉丰富的电影和电视内容呈现提供了一个高效且可控的混合场景全息重放框架，尽管其深度应用范围仍然有限，专门的实时性能测试留待未来的工作来完成。

1. 引言
全息术与立体声和多视图显示从根本上不同，因为它能够重建光学波前本身，而不仅仅是提供双目近似效果。因此，从原理上讲，它可以在单一光学过程中保留调节、聚散、运动视差和连续的深度线索，这使得全息术在三维显示工程中极具吸引力[1,2]。从经典光学全息术向数字全息术的过渡建立了一条从实验室录制媒体到基于传感器的采集和数值重建的实用路径，使得全息显示能够从固定的光学设置发展成能够进行动态重放和算法控制重建的可编程计算-光学系统[3,4]。这一演变如今与虚拟现实、增强现实和交互式三维可视化的需求紧密相关，在这些应用中，全息术越来越被视为一种有前景的后端技术，因为它通过波前控制而不是仅仅通过视角复用来表示深度，尤其是在近眼和透视显示架构中[5,6]。同时，实际的全息显示仍然是一个计算密集型过程，因为它依赖于在诸如面板间距、可用带宽、重放几何形状和颜色通道同步等硬件限制下的基于衍射的数值生成，这使得可显示的全息图合成成为概念验证与实际部署系统之间的主要瓶颈[7,8]。
为了缓解这一瓶颈，计算机生成全息术的最新进展集中在合成质量和计算真实性上。基于路径追踪的逼真全息图生成表明，波光渲染可以结合全局照明效果，而面向实时的线框计算则展示了场景依赖的加速策略可以使得全息图生成更接近于结构化和稀疏目标的交互操作[9,10]。在算法加速方面也有同样的趋势：基于GPU的线对象计算和距离自适应神经全息术可以在特定的先验、传播设置或任务假设下降低计算成本，但这些方法主要仍在合成内容领域运作，并未直接解决如何将记录的实物全息图与数值合成全息图集成到单个可重放帧中的问题[11,12]。
与此同时，数字全息术的采集和重放分支也在快速发展。非相干和紧凑型数字全息术扩展了实际录制范围，超出了仅使用激光的实验室规模系统，而微型记录器和相位移动架构提高了在越来越紧凑和应用导向的配置中进行三维捕捉的可行性[13,14]。基于单路径LED的定量相位成像和偏振复用的非相干全息术进一步表明，数字全息图的采集正在变得更加硬件高效、对对齐要求更低，并且与紧凑型传感平台更加兼容[15,16]。这种面向硬件的趋势还体现在自参考记录模块和近眼重放架构中，其中紧凑型的自参考全息单元和LED驱动的非视差近眼全息术表明，全息图的生成和重放正朝着更加可部署和实用的配置发展[17,18]。在系统层面，眼框扩展和无混叠的广角数字全息术解决了像素化全息硬件的主要限制，包括受限的观察孔径和大衍射角下的光谱歧义[19,20]。最近的光学架构通过基于光片的连续深度全息术和波导全息术进一步扩展了全息显示的深度和耦合能力，适用于增强现实眼镜[21,22]。与此同时，通过广角全带宽频率复用近眼重放、非相干CGH、双面CGH以及从普通显示硬件生成的CGH，色彩重放和部署灵活性也得到了提升[23,24]。因此，全息显示正在发展成为一个包含不同照明、编码、重放拓扑和接口假设的更广泛的计算-光学管道家族，这种多样性还在扩展到应用导向的模式，如用于增强现实投影的线框全息术和裸眼超表面全息电影[25,26]。同时，校准和评估变得越来越重要，因为闭环优化、相位辅助的全息图校正和客观的条纹质量评估突显了在设备缺陷、孔径限制和非理想重放条件下实现可重复的光学保真度的需求[27,28]。
近年来，人们对具有缩放功能的微型化全息3D显示系统的兴趣也在增加。特别是，基于超表面的研究展示了一种0.18立方厘米的3D元全息缩放微投影仪和多波长消色差3D元全息术，强调了紧凑系统集成、可调图像规模和多波长操作在下一代全息显示研究中的重要性[29,30]。这些进展从不同的硬件方向补充了当前的工作。虽然那些研究主要强调基于超表面的缩放投影和微型化集成，但本研究侧重于基于LCOS的混合场景全息重放框架中的单全息图融合和保持视差的尺寸调整。
除了上述全息术方面的进展外，大量相关的SCI/SSCI研究进一步反映了数据驱动建模、智能感知、逆向分析、光谱和材料调制、嵌入式调度、多物理场模拟以及计算高效优化在复杂工程系统中的重要性。最近的研究涵盖了结构化机器学习和几何表示学习、热化学和光谱诊断、电磁和动态光谱材料、空间预测和环境暴露建模、自监督图像重建、异构嵌入式调度、因果学习、智能复合材料、催化和可再生能源系统、视觉缺陷检测、畸变敏感的机械分析、生物医学机制分析、信号去噪、物理集成的逆向建模以及受限系统模拟，这些共同强调了模型驱动智能和硬件-算法协同设计在先进计算-光学管道中的更广泛相关性[31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54]。
尽管取得了这些进展，当物理内容和虚拟内容必须共存于动态全息场景中时，仍有两个工程问题尚未得到充分解决。第一个问题是数字融合后的重放效率：尽管散斑减轻和重放优化可以改善可见质量，但它们并不能消除录制的数字全息图通常包含强烈的低频零阶成分这一事实，而合成的CGH通常是为了在不同的数值模型下最大化有用的一阶重建而编码的[55,56]。第二个问题是管道集成。大规模数字化全息术已经表明，物理对象和非物理对象可以在一个全息框架中表示，但通往紧凑的动态混合场景管道的实际路径仍受到直接全息图叠加后的衍射效率损失、记录传感器与重放面板之间的采样间距不匹配，以及缺乏在保持重放孔径和视差的同时允许对象级操作的快速尺寸调整策略的限制[57,58]。因此，实用的混合场景显示管道必须结合数字全息术和计算机生成全息术的优势，而不是将它们视为独立的子系统：录制的全息图保留了来自真实对象的测量波信息，而CGH则提供了对合成内容的完全数值可控性。未解决的问题是如何将这些两种数据类型融合成一个可重放的全息图，同时不牺牲亮度、几何一致性和交互操作性，尤其是在同一平台必须支持场景融合、比例控制、局部对象平移以及单个像素化调制设备上的颜色重放的情况下[59]。
本研究通过针对高效混合场景重放定制的单全息图计算-光学管道解决了混合场景问题。第一个贡献是一种融合策略，通过高通预处理抑制记录的数字全息图的零阶负担，然后在全息图叠加之前对记录和重放的采样网格进行对齐。第二个贡献是一对旨在保持有效全息孔径和视差角的数字尺寸调整方法，其中频域方法进一步实现了混合场景内指定对象的选择性缩放和平移。第三个贡献是一个三通道LCOS重放原型，它在一个工程框架内展示了单色融合、全场景缩放、选择性对象操作、混合场景颜色重放以及遮挡一致的深度排序。本文的其余部分组织如下：第2节阐述了离轴全息模型、采样限制、编码规则和任务定义。第3节介绍了提出的融合和尺寸调整方法以及畸变边界。第4节描述了光学重建平台和评估协议。第5节报告了重放结果，并讨论了该方法的工程范围和局限性。第6节总结了本文。

2. 理论基础和问题表述
2.1. 离轴数字全息术和重建模型
数字全息术记录了物体波与参考波之间的干涉。除非另有说明，x和y表示全息平面上的笛卡尔坐标，fx和fy表示空间频率坐标，λ表示波长，上标*表示复共轭。全息平面上的记录强度为：
(1) ，其中和分别是物体波和参考波的复振幅；和分别是相应的振幅分布；和分别是相位分布；是虚数单位；表示全息平面上的笛卡尔坐标。
(2) ，其中是全息平面上的记录强度；和分别是物体波和参考波；上标表示复共轭。
强度包含了物体自项、参考自项以及携带物体振幅和相位信息的交叉项。在线性记录和相干重放下，传输场可以分解为四个分量：
(3) ，其中是重建过程中的传输场；是重建波；是全息图透射率；和分别表示零阶项；表示所需的一阶重建；表示共轭图像项。这种分解的工程重要性是直接的：如果零阶成分仍然很强，它会占据低空间频率，增加全息图的偏差，并在重放后与有用的重建图像竞争。
在离轴系统中，一阶项和共轭项在空间频率域中偏离原点，从而减少了与零阶项的重叠。实现光谱分离所需的最小离轴角度表示为：
(4) ，其中θmin是实现光谱分离所需的最小离轴角度，B是物体光谱的半带宽，λ是重放波长。这个条件定义了后续过滤和频带选择可用的几何裕度。对于当前的工作，实际后果是，只要记录的全息图满足离轴分离要求，就可以在融合之前减弱数字全息图的零阶项，而不去除有用的一阶物体信息。
重建模型还阐明了为什么优先考虑零阶抑制而不是其他预处理步骤。一旦零阶项残留在融合后的全息图中，它会均匀地贡献偏差能量，但不会帮助混合场景携带更多的物体信息。因此，提出的融合路径首先针对低频零阶成分，然后再进行采样率匹配和全息图叠加。
2.2. 采样、带宽和参数匹配限制
数字全息术的重放质量由最大可记录的空间频率以及记录和显示阶段使用的采样间隔决定。一般要求是全息图采样间距必须满足关于最大空间频率的奈奎斯特条件：
(5) ，其中是全息图采样间距，是可以在全息平面上记录的最大空间频率。对于离轴记录几何结构，最大空间频率共同取决于物体的范围、参考波载波和记录距离。实际工程形式的采样约束是（6），其中Δh是全息图采样间距，fh,max是全息图能够记录的最大空间频率，λ是波长，z是记录距离，xh,max是全息图支撑结构沿x方向的最大半幅宽，xo,max是物体支撑结构沿x方向的最大半幅宽，xr,max是沿x方向的参考波有效偏移量。这个表达式将光学几何特性与无失真重放所需的像素间距联系起来。在混合场景重放中的关键工程问题是，数字全息图和重放面板是由不同的设备采样的。在这里考虑的实验中，数字全息图是由像素间距为3.5 μm的CCD记录的，而重放面板是由像素间距为4.06 μm的LCOS实现的。如果未经间距转换就将记录的全息图写入LCOS，全息图平面的物理缩放就会改变，重构的物体在大小和位置上相对于CGH生成的虚拟物体会发生偏移。这种不匹配会直接破坏混合场景的对齐。全息图缩放的几何效应可以通过重构的坐标来表达。如果全息图通过缩放因子进行了大小调整，重构的点坐标变为（7），其中是重构的点坐标，是物体点坐标，是参考源坐标，是重构源坐标，是全息图缩放因子，是用来简化坐标表达式的辅助分母。这些显式的坐标表达式不如它们的含义重要：任何有效全息图比例的变化都会改变重放几何特性。因此，通过重采样进行间距匹配不是一个可选择的实现细节，而是记录的物理内容与数值合成虚拟内容之间一致融合的必要条件。

2.3. 本文中使用的CGH编码策略
目前的工作中只保留了一种CGH编码策略：双极强度编码。其他CGH家族，包括多子单元复振幅编码和一般干涉编码，在特定的硬件约束下仍然有用，但在这里没有采用，因为它们要么增加了实际采样负担，要么对于单全息图融合来说提供不太理想的光谱紧凑性。所有后续实验中使用的CGH都是通过双极强度表达式（8）生成的，其中是生成的计算机生成的全息图，是目标振幅分布，是目标相位分布，是y方向上的载波角度，λ是重放波长。这种编码在这里有三个优点：它将零阶带宽压缩成一个紧凑的偏置项，它可以产生一个带有轴外载波的可重放的一阶图像，并且它支持与处理过的数字全息图的直接数值叠加。相应的采样条件可以表示为（9），其中是全息图采样间距，是参考波谱的带宽，是物体波的最大空间频率。在混合场景管线中，这种光谱紧凑性减轻了重放面板的负担，并为预处理后的数字全息图分支留下了更多空间。

2.4. 混合场景融合和数字缩放的问题定义
混合场景显示问题通过两个耦合的设计目标来表述。第一个目标是将记录的数字全息图和合成的CGH融合成一个可重放的全息图，同时抑制由低频零阶项引起的衍射效率损失，并消除不同设备间距引入的几何不匹配。输出必须以一致的尺度和稳定的可见性重建物理和虚拟物体。第二个目标是在不减少有效重放孔径的情况下调整重构内容的大小，从而不缩小视差角。该方法还应避免完全重新计算CGH的成本，并且最好支持在混合场景内部对选定物体的局部操作。因此，考虑了两种缩放方式：一种是在空间域中通过区域操作来保持孔径的方法；另一种是在频域中操作对应于特定物体的选定位谱区域的方法。根据这些目标定义了评估指标。对于融合目标，主要标准是重放可见性、相对衍射效率趋势以及物理物体和虚拟物体之间的对齐。对于缩放目标，主要标准是缩放的正确性、保持重放孔径、物体选择性可控性以及符合人类感知边界内的可接受畸变。在最终的重放实验中，颜色一致性和遮挡真实性被用作系统级别的验证标准。

3. 提出的方法
3.1. 混合场景全息图合成流程
完整的合成流程从两个异构数据源开始，并将它们转换成一个可重放的全息图。首先将物理物体记录为数字全息图。同时，将虚拟物体转换为在相同标称重放几何条件下的CGH。然后对数字全息图进行滤波和重采样，用双极强度编码生成CGH，将两个全息图归一化到一个兼容的数值范围内，最后将最终的混合场景全息图写入LCOS进行光学重放。原则上存在三种融合方式。第一种方式使用多个空间光调制器并在空间中进行光学合成。这种方法可以保持各个全息图的质量，但它需要多面板对齐，并且在紧凑的动态系统中难以扩展。第二种方式从记录的全息图中重建或估计物体的复振幅，然后从组合场景中重新计算一个新的CGH。这种方法适用于静态打印和高保真离线合成，但它引入了较大的计算成本。第三种方法直接将数字全息图和CGH作为全息图域数据叠加。这种方法计算成本低廉，并且与高效的混合场景重放结构兼容，但它会受到衍射效率损失和采样不匹配的影响。目前的工作采用了第三种方法，并解决了其两个主要缺陷，而不是增加重放系统的复杂性。

3.2. 提高衍射效率的融合方法
直接数值叠加很方便，但在光学上效率较低。定义衍射效率为（10），其中η是衍射效率，S是衍射重放场振幅，P是入射重放场振幅，上标*表示复共轭。因此，和分别表示衍射和入射的强度。对于理想的数字全息图，可用的一阶衍射效率可以达到大约40.4%的经典最大值。然而，一旦直接叠加两个全息图，偏置项会增加，每个重构物体的可用衍射效率就会降低。对于多个全息图的直接叠加，有效透射率可以表示为（11），其中Φdirect是直接叠加下的有效透射率，m是叠加的全息图数量，Oi是第i个物体波的复振幅，R是参考波，上标*表示复共轭。前两项构成了较大的偏置贡献。在将一个数字全息图与一个CGH融合的特定情况下，偏置主要由数字全息图的零阶分量主导。如果不进行预处理，分配给每个重构物体的有用衍射效率会降至双向融合预测的大约倒数平方的趋势。对于两个全息图的情况，每个物体的趋势约为10.1%，这与重放中观察到的亮度衰减一致。提出的解决方案是在叠加之前去除主导的低频偏置。首先对数字全息图应用高通滤波器，以减弱零阶项，同时保留轴外的第一阶带。滤波后，透射率变为（12），其中Φfiltered是零阶抑制后的有效透射率，C是残余的恒定偏置项，Oi是第i个物体波的复振幅，R是参考波，上标*表示复共轭。在这种条件下，分配给每个物体的有用衍射效率遵循过滤叠加预期的倒数趋势。对于两个全息图的情况，趋势上升到大约20.05%，这与期望的重放亮度增益一致。对于数字全息图的预处理，采用了高斯高通滤波器（13），其中H(fx, fy)是高斯高通滤波器传递函数，fx和fy是空间频率坐标，D(fx, fy)是从谱原点开始的径向距离，D0是截止半径。首先使用傅里叶变换将记录的数字全息图转换到频域。然后应用高斯高通滤波器来抑制低频零阶带，实验中使用了2400的截止半径。之后，通过逆傅里叶变换重构滤波后的全息图。为了匹配LCOS硬件的重放间距，将过滤后的数字全息图从3.5 μm的像素间距重采样到4.06 μm。最后，将处理后的数字全息图与CGH叠加，并将组合结果归一化（14），其中HM(x, y)是最终混合全息图，HDH(x, y)是预处理后的数字全息图，HCGH(x, y)是计算机生成的全息图，normal{·}表示归一化到可用的显示动态范围。这种归一化使用了LCOS输入的整个动态范围。这一序列最小化了不必要的重新计算，保留了记录物体的第一阶内容，并将直接的全息图叠加转换为可重放的混合场景全息图合成方法。对于本文考虑的两个全息图融合情况，在直接数值叠加下，每个重构物体的定量衍射效率趋势大约为10.1%，而抑制零阶的融合将相应的值提高到大约20.05%。表1总结了这些值以及理想的单全息图参考值。

表1. 融合分析中使用的理论衍射效率趋势。表1中列出的值是从融合模型中得出的理论结果，用于分析第5.1节讨论的比较重放观察结果。

3.3. 保留视差的空间域缩放方法
简单的全帧插值或抽取不足以调整全息图的大小。如果通过插值放大全息图并且只保留中心部分进行重放，那么全息图边界附近的高频信息将会丢失。如果通过抽取缩小全息图并将其作为一个更小的有效孔径进行重放，视差角会减小，光学功率利用率也会降低。这两种结果在交互式显示中都是不希望出现的。空间域方法通过保留最终全息图的孔径来避免这些问题。在本工作中使用的实现中，全息图被分割成四个大小相等、不重叠的矩形子区域，分别对应于原始全息图的左上、右上、左下和右下象限。如果全息图的大小为M × N，每个子区域的大小为M/2 × N/2。相邻子区域之间没有重叠。然后根据所需的重放缩放因子独立处理每个象限。对于缩放，首先按照规定的因子对每个象限进行插值。插值后，只保留与原始象限大小相对应的中心部分，而新生成的外部边界样本被丢弃。然后，将保留的中心块重新组装成全尺寸的全息图，分别放置回左上、右上、左下和右下位置。这样，拼接线保持在原始象限边界处不变，插值生成的边缘区域不会直接拼接到输出全息图中。对于放大，首先根据目标缩放因子对每个象限进行下采样，然后将其复制或填充回其原始象限支撑中，以保持全息图孔径不变。因为每个处理块总是被写回其原始的空间象限，所以该方法保持了原始全息图布局与调整后全息图布局之间的对应关系。因此，边界处理是通过逐象限独立处理和固定位置重新组装来实现的。在缩小情况下，通过丢弃插值生成的外部边缘并仅保留每个处理块的中心部分来缓解不连续性。在放大情况下，通过在重新组装过程中保持原始象限位置来减少不连续性，而不是引入跨象限混合或任意缝合。在当前的实现中不使用重叠混合；相反，通过保持缝合位置不变并避免直接使用插值期间创建的边界样本来改善连续性。全息图缩放与重放缩放之间的理论关系来自衍射模型。如果全息图平面坐标被缩放，重构的场将变为（15）式，其中uo′(xo′)是缩放后的重构场，xo′是缩放后的重构平面坐标，x是全息图平面积分变量，o(x)是原始全息图分布，m是全息图缩放因子，λ是波长，R是傅里叶变换记录几何中的参考/物体距离。主要含义是，调整全息图的大小会以与全息图缩放因子相反的方式重新调整重构图像的大小。所提出的空间域方法利用了这一关系，同时防止了孔径损失。其实际好处有三个：有效的重放区域保持不变，视差角得到保留，与简单的全帧裁剪和调整方法相比，边缘带信息的损失减少了。在这种按象限划分的方案中，固定接缝位置的保持和中心块保留的使用对于在空间域调整大小时抑制边界引起的拼接伪影也非常重要。

3.4 频域对象选择性调整和平移
频率域方法增加了选择性。它不是均匀处理整个全息图，而是隔离与目标对象相关的光谱带，并在将全息图转换回空间域之前对该光谱带进行操作。这种方法既可以实现整个场景的重放缩放，也可以在混合场景中对对象进行操作。选定的对象光谱在频率域中按（16）式调整大小，其中Fm(fx, fy)是缩放后的目标光谱，FO(fx, fy)是对象光谱，FR*(fx, fy)是共轭的参考波光谱，Intm{·}表示通过因子m进行的光谱缩放/插值，fx和fy是空间频率坐标。频率域调整大小后，通过傅里叶逆变换和实值归一化在空间域中重构处理后的全息图：（17）式，其中H′(x, y)是用于显示的处理后全息图，F?1{·}表示傅里叶逆变换，Δfx和Δfy分别表示水平频率移动和垂直频率移动，normal{·}表示归一化到显示动态范围。如果在这个方程中保留实部运算符，则应明确写为Re{·}，并在此定义为实部提取。水平和垂直频率移动会在重放平面上平移选定的对象。因此，通过相同的频段选择框架实现了大小调整和平移。在混合场景全息图中，这意味着如果可以从数字全息图中重放物理对象或通过CGH合成的虚拟对象，只要其光谱支持能够与其他场景成分充分分离，就可以独立地进行操作。该方法的流程如下：首先将重放的全息图转换到频率域，然后选择包含目标对象信息的频段，对该频段进行插值或抽稀以实现所需的重放缩放，可选地应用频率移动进行平移，最后通过傅里叶逆变换将处理后的频段转换回空间域并进行归一化以用于显示。这种基于频段选择的路径是后面报告的对象级演示的计算基础。

3.5 扭曲分析和适用范围
调整大小后的全息图不会均匀保持所有三个空间维度。横向缩放和纵向深度缩放不同，因为重构的几何形状取决于光学传播模型。因此，产生的扭曲必须通过感知标准来限定，而不是严格的欧几里得相似性条件。通过将纵向扭曲与人类立体视觉感知的最小可分辨深度间隔进行比较，可以得到一个实用的标准。使用本工作中采用的重放几何结构，纵向扭曲增量可以表示为（18）式，其中Δzi是重放空间中的纵向扭曲增量，m是全息图缩放因子，zo是物体到全息图平面的距离，zc是重放距离，Δzo是物体的一半深度。当感知深度阈值约为0.33毫米时（这是根据源分析中讨论的眼模型的关系得出的），可以限定目标放大倍数的允许物体半深度。对于重放实验中使用的参数集，物体距离和重放距离均为1200毫米，四倍的放大倍数对应于四分之一的全息图缩放因子。将这些值代入扭曲界限可以得到允许的物体半深度为23.13毫米。因此，总纵向深度小于46.26毫米的物体可以放大4倍而不会产生明显的感知扭曲。这一界限定义了调整大小方法的工程适用性：对于浅层或中等深度的物体，较大的重放缩放仍然是可接受的，而深度扩展较大的场景则需要较弱的缩放或额外的补偿。为了清晰起见，表2总结了在所报告的重放几何结构下的深度相关适用性。

4. 实验设置和评估协议
4.1 光学重建平台
光学重放是在一个三通道LCOS平台上实现的，配置了独立的红色、绿色和蓝色重建路径。红色、绿色和蓝色的波长分别为632纳米、532纳米和473纳米。每个通道使用分辨率为4096 × 2160、像素间距为4.06微米的LCOS面板。每个通道中的照明被准直并扩展成类似点光源的重放光束。在光束到达LCOS之前，每个路径中使用了两个焦距为30厘米的透镜。三个通道通过X立方体棱镜结合，并汇聚到一个预定义的重放平面，在那里观察到一个真实图像。系统以两种模式运行。首先在红色通道中进行单色验证，以便在没有颜色通道交叉效应的情况下观察融合和调整大小的行为。然后，所有三个通道都激活，进行系统级别的混合场景重放，从而可以在相同的光学几何结构下评估颜色组合和多对象对齐。

4.2 数字全息图采集和CGH生成设置
数字全息图分支记录了一个真实的瓢虫目标。下面描述了记录的物体及其全息图的特征（图1）。图1. 小蜜蜂的数字全息图。用于记录的CCD分辨率为2000 × 2000像素，像素间距为3.5微米。物体中心距离CCD平面大约350毫米，记录波长为632纳米。瓢虫目标的实际大小约为10毫米 × 7毫米。这些参数定义了记录的物体比例和必须后续过滤和重采样的离轴光谱。虚拟分支使用一个二维狮子图像作为CGH目标。下面描述了目标和生成的全息图的特征（图2）。图2. 2D熊猫目标的CGH。狮子目标的设计尺寸为12毫米 × 12毫米。CGH是为相同的标称重放距离350毫米和相同的波长632纳米生成的。CGH的采样间距设置为4.06微米，与LCOS的间距相匹配，全息图分辨率为2000 × 2000。这种参数选择有意将数字全息图分支作为间距不匹配的来源，因此测试变量是融合算法而不是目标几何形状。

4.3 基线、比较设计和评估标准
融合实验使用了四种基线条件。案例A仅重放数字全息图。案例B仅重放CGH。案例C直接对数字全息图和CGH进行数值叠加，没有任何预处理。案例D使用所提出的融合方法，包括高通滤波、间距匹配和归一化叠加。案例A和B确定了两个分支的独立重放质量，案例C揭示了简单融合所带来的退化，案例D隔离了所提出算法带来的改进。调整大小实验使用了三种比较方法。案例E是一个概念性的简单全帧调整大小逻辑，用作讨论的基线。案例F是基于区域处理和拼接的所提出的空间域调整大小方法。案例G是基于光谱选择和逆变换的所提出的频率域方法。案例E没有通过单独的图表来强调，因为其主要价值在于解释：它揭示了当全息图调整大小通过直接裁剪或全局缩放处理时会出现的孔径损失和边界信息损失。所有实验都使用了五个评估标准。第一个是重放可见性，通过图像亮度和对比度趋势来评估。第二个是衍射效率行为，通过第3.2节中的定量分析和第5.1节中讨论的相应比较重建结果来评估。第三个是目标一致的几何调整大小，通过重放对象是否遵循规定的缩放设置同时保持有效孔径来评估。第四是目标一致的对象平移，通过选择的对象是否遵循规定的水平或垂直移动来评估。第五是系统级别的真实感，通过颜色对准和遮挡行为来评估。同时，本手稿没有报告校准的信噪比或对比度测量、缩放因子误差统计或定位精度测量。因此，本工作中融合和调整大小方法的验证应解释为理论分析结合比较光学生可行性证据，而不是完整的定量性能基准。

4.4 颜色混合场景和遮挡实验设计
最终实验将融合的全息图流程与选择性的频率域控制集成在一起。从RGB场景数据生成三个颜色通道。数字全息图仅与红色通道的CGH融合，而绿色和蓝色的虚拟成分则通过它们专用的LCOS通道生成并重放。保持每个LCOS面板到重放焦平面的光学路径长度相等，以便三种颜色成分在预期的重建位置重叠。定义了六个重放任务。任务1重建由真实瓢虫、虚拟三维图形和汉字“好”组成的颜色混合场景。任务2放大三维虚拟图形。任务3放大真实瓢虫。任务4水平平移字符“好”。任务5同时在水平和垂直方向平移瓢虫。任务6引入一个遮挡掩模，以便在重叠区域正确隐藏后面的物体。这些任务测试了融合后的混合场景中的重放可行性、对象选择性可控性和深度排序。然而，由于本研究中没有使用相机进行焦平面扫描，因此这个实验不被视为完整的体积重建验证。

5. 结果和讨论
5.1 预处理前后的融合结果
融合实验在四种条件下进行了分析：仅重放数字全息图、仅重放CGH、未经预处理的直接数值叠加以及基于所提出的预处理的融合。单个全息图案例确立了记录的物理对象和合成虚拟对象的独立重放可见性。表1总结了本分析中使用的理论衍射效率趋势。在直接数值叠加的情况下，两个重构的对象仍然可见，但由于有用的第一阶重放能量被放大的偏差项重新分配，每个对象的亮度显著降低。这种行为与第3.2节中的衍射效率分析一致。对于两个全息图的融合情况，相应的理论衍射效率趋势大约为每个重构对象10.1%。经过高通滤波、间距匹配和归一化叠加后，数字全息图的主要零阶负担显著减少，混合场景的重放恢复了显著更高的亮度水平。在这种情况下，相应的理论趋势上升到每个重构对象大约20.05%。在没有校准的绝对光学功率测量的情况下，本实验的作用是验证预测的变化方向——即，在零阶抑制后恢复第一阶重放亮度——而不是声称精确再现表1中列出的绝对值。

5.2 空间域调整大小结果
空间域调整大小方法首先修改了全息图结构本身。如图3所示，局部放大的调整大小后的全息图显示了区域处理如何改变条纹分布，同时保持了全尺寸的重放孔径（图3）。图3. 重采样和拼接后的局部放大调整大小后的全息图。(a) 放大2倍的重建图像的全息图；(b) 放大4倍的重建图像的全息图。下面显示了原始设置以及0.5×、2×和4×缩放设置下的重放结果（图4）。图4.使用空间域调整进行的光学重建。(a) 原始全息图的光学重建结果；(b) 缩放0.5倍的重建结果；(c) 放大2倍的重建结果；(d) 放大4倍的重建结果。0.5倍的缩小比例在保持稳定的重放位置的同时，使得狮子图像变得更小。2倍的放大比例产生了更大的重建结果，且没有简单的中心裁剪带来的严重边缘失真。4倍的放大比例进一步增加了重放图像的大小，同时保持了整个全息图区域的活性。最重要的观察结果是，不仅重放图像的大小正确变化，而且该方法保留了全息图的有效孔径。由于最终的全息图仍然占据LCOS的整个区域，因此没有因为有效孔径的物理缩小而导致的视差角变化。相对于简单的整体帧调整逻辑，这种区域处理方式缓解了边界信息的丢失和重放孔径的丢失。这些重建结果也与第3.3节中描述的四象限重组策略一致，表明在所报告的实验设置下，固定边界的拼接方案不会引入主要的拼接伪影。在本文中，这些结果被报告为目标一致的重放演示，而不是作为理论和测量缩放因子之间的校准相对误差测量。

5.3. 频域调整和平移结果
频域方法修改的是选定的对象光谱，而不是空间全息图瓦片。下面展示了用于重放放大的全息图纹理（图5）。
图5. 频域调整后的局部放大全息图。(a) 放大2倍的重建图像对应的全息图；(b) 放大4倍的重建图像对应的全息图。整体调整行为与空间域方法相似：重放的狮子图像在0.5倍时缩小，在2倍和4倍时放大，同时仍然可以进行光学重建。当在混合场景中操纵单个对象时，频域方法显示出更强的优势。下面展示了这些结果。频域方法能够选择性地操纵混合场景中的单个对象。在演示的控制任务中，虚拟三维图形可以放大1.5倍，而物理蜜蜂可以放大2倍，表明数字全息图分支在融合后仍然可以选择性地进行控制。除了缩放之外，该方法还支持对象平移。汉字“好”可以在水平方向上移动5毫米，物理蜜蜂可以在水平方向上移动2.5毫米，在垂直方向上移动5毫米。这些操作在完整的CGH重新计算中将非常繁琐，并且不是空间域区域方法自然支持的。因此，频域方法提供了一个更具表现力的控制界面：它不仅是一种重放缩放技术，也是一种用于混合场景全息图的光谱选择性对象操纵机制。同样，所报告的局部缩放和平移案例旨在展示重放平面中的可控目标操作，但它们并没有作为像素或毫米级别的定位精度校准测量来呈现。

5.4. 混合场景重放和深度排序结果
最终实验评估了在三通道操作下的混合场景重放。重放结合了一个物理瓢虫、一个棋盘背景和一个虚拟三维图形。棋盘重放的尺寸大约为15毫米×15毫米，而瓢虫重放的尺寸大约为7毫米×10毫米。这些结果证实了过滤和重采样的融合方法与颜色通道合成以及随后的对象选择性操作是兼容的。本实验中的深度相关证据主要通过场景层组合和遮挡一致性排序来表达。当通过二进制掩模抑制重叠区域中的后置对象贡献时，重放与正常深度感知更加一致。然而，这种验证仍然基于深度排序，而不是在多个重建深度上的焦平面相机扫描。因此，本实验支持具有深度排序的可控混合场景重放，但本身并不构成体积3D重建能力的完整验证。

5.5. 工程讨论和论文层次声明
本工作展示了一种使用单一融合全息图的计算-光学混合场景重放方法。融合方法之所以高效，是因为它避免了多面板光学融合，也不需要从恢复的复杂振幅中完全重新计算混合场景。调整方法之所以实用，是因为它们被定义为全息图域或频域变换，而不是重复的场景到全息图的合成。频域方法还支持对象选择性操纵，这对于交互式全息显示界面非常重要。从计算角度来看，所提出的流程比完整的混合场景全息图重新合成更为轻量。在融合分支中，记录的数字全息图经过一次傅里叶变换、一次高通滤波操作、一次逆傅里叶变换、一次重采样步骤，然后与CGH直接叠加。CGH分支在固定的重放几何结构下使用双极强度编码。在调整分支中，空间域方法主要依赖于区域插值或下采样，然后是拼接或复制，而频域方法需要一次傅里叶变换、带宽选择和缩放、可选的频率移动、一次逆傅里叶变换和归一化。这些操作都比重新计算整个混合场景然后再从头开始计算新的全息图要简单。然而，由于本文没有报告每个阶段的定时基准或帧率评估，因此本文并不声称已经实验性地展示了实时动态显示。同时，当前的实验目标大多是平面或准平面的，深度相关的验证仅限于场景分层、对象选择性操纵、遮挡一致性排序以及第3.5节中的理论深度适用性分析。在报告的重放几何结构下，当对象半深度低于23.13毫米时，4倍的放大情况仍然在无明显失真的范围内，对应的总纵向深度低于46.26毫米。然而，由于本研究没有包括基于相机的焦平面扫描，因此不应将本文解释为跨越多个轴向深度的体积重建的完整实验演示。更完整的定量评估还需要包括基于图像的信噪比或对比度测量、规定和测量缩放因子之间的相对误差分析，以及平移操作的定位精度评估。这些指标在本文中没有报告。因此，当前的实验证据应当被解释为支持可行性、可控性和目标一致的重放行为，而不是完全的定量精度基准。

本研究的声明是有意限制的。验证结合了定量衍射效率分析和在三-LCOS原型上的比较光学重建结果。由于当前设置中没有包括校准的绝对光功率测量，因此衍射效率结果应被解释为由比较重放观察结果支持的理论上推导出的改进趋势，而不是实验测量得到的绝对效率值。大孔径或大体积的重放仍然受到当前面板间距和孔径的限制。此外，尽管所提出的工作流程在计算上比完整的CGH重新计算更为轻量，但本文没有包括每个阶段的计时数据或帧率基准。因此，这些结果应被解释为高效的混合场景全息重放框架的证据，而不是实时动态显示的实验演示。在这些限制范围内，研究表明，零级抑制融合和保持视差的调整足以将记录的全息图和合成的全息图转换为实际LCOS硬件上的可控混合场景重放信号。

6. 结论
6.1. 结论总结发现
已经展示了一种用于混合物理-虚拟全息重放的单全息图融合框架。该方法结合了三个操作：对记录的数字全息图进行高通滤波以抑制零级项，将CCD采样间隔转换为LCOS采样间隔，以及使用双极强度编码生成的CGH进行归一化叠加。这一序列减轻了直接全息图叠加时出现的衍射效率损失。对于这里讨论的双全息图融合情况，相应的理论衍射效率趋势从直接叠加下的每个重建对象大约10.1%提高到了零级抑制预处理后的大约20.05%。当前的实验通过比较重放可见性支持了这一预测的改进方向，尽管当前研究没有包括绝对光功率验证。从计算角度来看，该方法避免了完整的混合场景全息图重新合成，而是依赖于紧凑的全息图域预处理和融合操作序列，但其实时可行性尚未通过本文中的定时基准得到确认。还展示了两种保持孔径的调整策略。空间域方法使用区域插值或抽取，结合拼接或复制来保持重放孔径不变。频域方法操纵选定的光谱带，因此支持对象选择性调整和平移。在三通道LCOS平台上的光学重放支持单色融合、不同因子的缩放、混合场景彩色重放和遮挡一致的深度排序。结合畸变分析，综合结果表明，混合场景全息图融合和交互式重放操纵可以在一个计算-光学框架中实现，而不会过度增加重放系统的复杂性。然而，对体积重建的完整相机重新聚焦验证超出了本研究的范围。

6.2. 限制和未来工作
将该方法扩展到更大体积的重放将需要更细间距的空间光调制器、更大的有效孔径，或者保留当前流程计算简单性的合成孔径策略。降低重放平台的硬件负担将需要比当前三激光布置更紧凑的照明和颜色组合架构。未来的工作将通过使用校准的光功率读出的代表性一级衍射效率测量、基于图像的信噪比或对比度分析、规定和测量缩放因子之间的相对误差评估、像素或毫米级的平移位置精度测量、几何缩放误差分析、对象操纵精度测试、基于相机的跨多个重建深度的焦平面扫描、每个阶段的定时基准、帧率评估以及交互式全息显示场景的感知层次用户研究来进一步扩展当前的验证。

热点排行