1. 项目概述当量子电路遇见神经网络在计算化学领域我们一直在寻找一种“圣杯”一种既能精确描述复杂分子电子结构又能在实际硬件上高效运行的方法。经典方法如耦合簇CCSD虽然精度高但计算成本随体系规模呈指数级增长而新兴的量子计算方法如变分量子本征求解器VQE虽然理论上能利用量子优势但受限于当前嘈杂中型量子NISQ设备的深度和噪声往往在精度和资源消耗之间艰难取舍。我最近深度研究并实践了一个名为pUNN的新框架它巧妙地绕开了这个两难困境。这个框架的核心思想非常直观为什么不把量子电路最擅长的事情高效学习量子相位结构和神经网络最擅长的事情高精度拟合复杂函数结合起来呢pUNN正是这样一个混合量子-神经波函数框架。它使用一个浅层、高效的量子电路具体是配对酉耦合簇双激发pUCCD作为波函数的“骨架”负责捕捉电子配对的核心关联同时用一个经典的神经网络作为“修正器”来弥补量子电路因简化模型如只考虑成对电子而忽略掉的那些复杂电子构型。实测下来这个组合拳的效果令人印象深刻。在多个分子体系如N₂, CH₄的数值模拟中pUNN达到了接近“化学精度”约1.6毫哈特里的水平与金标准方法CCSD(T)和需要更深电路的UCCSD相当。更关键的是它只需要N个量子比特N为分子轨道数而不是UCCSD所需的2N个并且电路深度极浅约20层而UCCSD可达上千层。这意味着它在当前和近期的量子硬件上具有极高的可行性。我们甚至在超导量子计算机上对一个具有挑战性的多参考体系——环丁二烯的异构化反应过渡态——进行了计算结果验证了该方法在真实噪声环境下的高精度和鲁棒性。无论你是计算化学的研究者对量子机器学习感兴趣的工程师还是寻找NISQ时代实用量子算法方案的探索者理解pUNN的设计思路和实现细节都能为你打开一扇新的大门。它不仅仅是一个算法更代表了一种务实的设计哲学在量子硬件尚未完美之前如何通过经典-量子混合架构最大化现有设备的实用价值。2. 核心设计思路为何是“量子骨架”加“神经修正”要理解pUNN首先要拆解它面对的核心问题以及为何选择这样的混合架构。这背后是一系列基于物理约束和工程现实的权衡。2.1 量子化学计算的精度困局与资源瓶颈计算分子能量的本质是求解多电子薛定谔方程。全组态相互作用FCI是精确解但其计算复杂度随电子数指数爆炸完全不实用。因此所有实用方法都是近似。经典方法的局限像MP2、CCSD这类基于微扰论或耦合簇理论的方法虽然对弱关联体系很准但其理论基础是单参考态。对于像化学键断裂、过渡金属络合物或环丁二烯过渡态这样的“强关联”体系电子离域严重单参考近似失效CCSD的结果会严重偏离甚至不收敛。纯量子方法的挑战VQE框架下的UCCSD包含单双激发的酉耦合簇是量子版本的CCSD理论上能处理强关联。但问题在于量子资源需求高需要2N个量子比特来编码所有自旋轨道。电路深度大UCCSD线路包含大量参数化旋转门和CNOT门深度轻易超过上千。在当前NISQ设备上如此深的线路会被噪声彻底淹没结果不可信。优化难题参数空间巨大且存在“贫瘠高原”现象梯度消失使得优化极其困难。2.2 pUCCD一个高效但“不完整”的量子骨架为了降低资源消耗研究者们转向了更精简的ansatz试探波函数。pUCCD配对酉耦合簇双激发就是一个杰出的代表。它的核心假设是“电子成对”每个空间轨道上要么占据两个自旋相反的电子双占据要么全空。这被称为“seniority-zero”子空间。优势量子比特减半只需要N个量子比特每个比特代表一个空间轨道对的占据情况。电路极浅电路仅由一系列“Givens-Swap”门构成深度仅为O(N)对于中等体系深度约在20层左右非常适合NISQ设备。物理图像清晰很好地描述了以电子对关联为主的体系。劣势表达能力受限它完全忽略了“单占据”的电子构型即一个轨道上只有一个电子。对于很多化学体系尤其是涉及自由基、键断裂或过渡态的强关联过程这些单占据构型贡献显著。忽略它们会导致系统性误差如图2所示pUCCD的误差比UCCSD高出一个数量级。注意pUCCD并非万能。它对于像H₂、LiH这样电子对关联主导的分子效果很好但对于像N₂存在三键、过渡态等需要描述电子非局域化的体系其精度就捉襟见肘了。选择它作为“骨架”是在当前硬件限制下对“可行性”和“基础表达能力”的妥协。2.3 神经网络的角色从“骨架”到“完整躯体”神经网络特别是深度神经网络在表示复杂高维函数方面具有近乎无限的表现力。近年来FermiNet、PauliNet等工作已证明神经网络波函数能以接近CCSD的精度求解薛定谔方程且计算复杂度更低。在pUNN中神经网络扮演着“修正器”或“补全器”的角色。量子电路pUCCD给出了一个在seniority-zero子空间内的、较好的初始波函数分布。然后神经网络的作用是学习并补全那些被pUCCD忽略的、存在于整个希尔伯特空间包含单占据构型的波函数振幅。具体来说整个混合波函数可以表示为|Ψ⟩ N̂ Ê ( Û(θ)|0⟩ ⊗ P̂|0⟩ )其中Û(θ)|0⟩是pUCCD电路产生的量子态N比特。P̂|0⟩是一个浅层的“扰动电路”作用于辅助比特产生的态目的是将状态微微推离全零基态引入微小混合。Ê是纠缠电路一系列CNOT门将主量子比特和辅助比特关联起来。N̂就是神经网络算子它作用于整个扩展后的2N比特空间对波函数系数进行调制。这里最精妙的设计在于测量协议。直接对这样一个量子-经典混合态进行测量是灾难性的可能需要量子态层析或指数级多的测量次数。pUNN通过巧妙的数学变换利用Ê是Clifford电路的性质将测量混合态期望值的问题转化为了分别测量量子电路部分和可经典模拟的浅层扰动电路部分再通过神经网络计算进行组合。这使得整个方案在测量次数上与传统量子化学方法如UCCSD效率相当避免了额外的测量开销。2.4 混合架构的协同优势分工明确扬长避短量子电路负责其擅长的、在希尔伯特空间中高效探索量子叠加和纠缠结构尤其是相位神经网络负责其擅长的、拟合高维复杂函数振幅。两者结合112。噪声鲁棒性由于核心量子电路pUCCD非常浅其对硬件噪声的敏感度远低于深层的UCCSD。神经网络在训练过程中某种程度上可以学习并补偿一部分固定的测量误差或较小的系统误差。资源效率保持了pUCCD的N比特、浅深度优势同时通过经典神经网络“免费”相对于量子资源地大幅提升了表达能力达到了接近2N比特、深电路方法的效果。3. 算法实现与关键步骤拆解理解了为什么之后我们来看怎么做。pUNN的实现是一个典型的变分量子算法流程但融合了神经网络的训练。下面我将拆解关键步骤和实操要点。3.1 整体工作流程pUNN的完整工作流程是一个量子-经典协同优化的循环初始化随机初始化pUCCD量子电路中的参数θ以及神经网络N̂的权重。量子电路执行与采样在量子计算机或模拟器上运行当前的pUCCD电路Û(θ)对输出态进行测量收集一批测量结果比特串k。经典扰动电路模拟在经典计算机上高效模拟浅层扰动电路P̂生成对应的辅助比特态|φ⟩的分布信息。能量期望值计算将步骤2和3得到的比特串k和j来自|φ⟩的采样输入神经网络N̂得到系数b_{kj}。利用设计好的测量协议公式参见原理论文附录B结合哈密顿量Ĥ的泡利字符串分解计算出当前波函数|Ψ⟩的能量期望值⟨E⟩。这个计算过程主要发生在经典侧。参数更新经典优化器使用经典的优化算法如L-BFGS-B用于无噪声模拟SOAP用于真实硬件根据能量梯度更新量子电路参数θ。神经网络优化器使用基于梯度的优化器如AdaMax根据能量损失更新神经网络权重。循环迭代重复步骤2-5直到能量收敛或达到最大迭代步数。3.2 量子电路构建pUCCD的实现细节pUCCD线路的构建是其高效性的核心。对于包含N个空间轨道的体系量子比特映射使用N个量子比特每个比特对应一个空间轨道对。|0⟩表示该轨道对空|1⟩表示双占据。激发算符pUCCD只包含双激发算符形式为exp[θ_{pq} (a^†_pα a^†_pβ a_qβ a_qα - h.c.)]其中p, q代表轨道索引。这意味着它只描述电子对从一个轨道对整体激发到另一个轨道对。线路编译每个双激发算符可以编译成一个“Givens-Swap”门。这是一个二量子比特门。在超导量子芯片上需要将Givens-Swap门进一步分解为原生门集如单比特旋转门Rz, Ry和CNOT门。一个重要的编译技巧在真实硬件实验中为了进一步压缩深度论文采用了近似移除了受控旋转门中的控制位。这虽然破坏了严格的粒子数守恒对称性但用较小的理论误差换来了大幅减少的CNOT门数量每个Givens旋转从4个CNOT减为2个在噪声环境下总体误差可能更低。这是一个典型的NISQ时代“实用主义”权衡。# 示例使用TenCirChem基于TensorCircuit构建一个简单分子如H2的pUCCD线路 import tencent.tencirchem as tcc from tensorcircuit import Circuit # 定义分子和计算参数 geometry [[H, [0.0, 0.0, 0.0]], [H, [0.0, 0.0, 0.74]]] # H2分子键长0.74埃 basis sto-3g charge 0 spin 0 # 创建pUCCD计算实例 ucc tcc.UCCSD(geometry, basis, charge, spin, enginetensornetwork) # 选择pUCCD即只保留双激发 ucc.config_reference(rhf) ucc.config_paired() # 关键设置为配对模式即pUCCD # 获取线路和参数 n_qubits ucc.n_qubits # 对于H2/STO-3G应为2冻结1s后 params ucc.init_guess # 初始参数 circuit ucc.get_circuit(params) # 获取参数化量子电路对象 # 可以可视化或进一步编译 print(f量子比特数: {n_qubits}) print(f参数数量: {len(params)}) # circuit.draw() # 绘制线路图3.3 神经网络设计与训练要点神经网络N̂的结构设计直接影响其表达能力和训练效率。输入与嵌入输入是长度为2N的比特串由主电路比特串k和扰动电路比特串j拼接而成。采用二进制嵌入将0/1映射为-1/1形成输入向量x0。网络结构采用全连接多层感知机MLP。深度L论文设置为L N - 3与体系大小成正比。对于8轨道体系L5。宽度隐藏层神经元数为2KN其中K是一个可调整数默认为2控制网络容量。宽度约为4N。激活函数使用ReLU。参数量总计约O(K^2 N^3)。对于N8, K2参数量在几千量级训练可控。粒子数守恒掩码这是将物理约束注入网络的关键。在输出层网络原始输出会乘以一个掩码m(k, j)。只有当比特串k和j中1的个数分别等于自旋向上和向下的电子数Nα和Nβ时掩码为1否则为0。这强制保证了波函数的粒子数守恒避免了非物理构型的贡献。训练技巧优化器使用AdaMaxAdam的变种初始学习率0.01并在线性衰减。初始化和随机种子神经网络权重需要随机初始化。论文中为了确保找到较低能量会用多个如5个不同的随机种子进行训练最后取能量最低的结果。这是应对非凸优化问题常用的策略。与量子参数的联合训练量子电路参数和神经网络参数是同时更新的。每次迭代中基于当前参数计算能量和梯度然后分别更新两部分参数。实操心得神经网络的“冷启动”问题在训练初期如果神经网络权重初始化不当或者量子电路参数离解太远可能导致梯度不稳定或优化陷入糟糕的局部极小值。一个有效的策略是进行预训练或分阶段训练。例如可以先固定量子电路参数用一组随机生成的构型样本单独训练神经网络几分钟让它初步学会如何根据比特串输出有意义的系数。然后再放开所有参数进行联合优化。这能显著提高训练的稳定性和收敛速度。3.4 高效测量协议算法的核心引擎这是pUNN算法中最精妙也是最复杂的一环。其目标是避免直接计算混合态|Ψ⟩与哈密顿量Ĥ的期望值因为那需要量子态层析或对指数多个基矢进行测量。核心思想利用纠缠电路Ê是Clifford电路具体是CNOT门乘积的性质进行如下变换⟨Ψ|Ĥ|Ψ⟩ ⟨ψ⊗φ| (ʆ N̂† Ê) (ʆ Ĥ Ê) (ʆ N̂ Ê) |ψ⊗φ⟩令Ĥ ʆ Ĥ Ê,N̂ ʆ N̂ Ê。由于Ê是Clifford门Ĥ仍然是泡利字符串的线性组合。关键是N̂的形式与N̂类似只是系数张量b_{kj}的索引发生了置换j - k⊕j异或操作。经过数学推导详见论文附录最终可以将⟨Ψ|Ĥ|Ψ⟩的计算分解为分别对量子态|ψ⟩和可经典模拟的扰动态|φ⟩进行测量然后将测量结果比特串的出现概率与神经网络计算出的系数b_{kj}进行组合。这样一来量子侧只需要在真实的量子设备上运行浅层的pUCCD电路Û(θ)并测量得到比特串k的分布P(k)。经典侧模拟P̂得到|φ⟩可以解析计算或采样得到比特串j的分布。对于哈密顿量中的每个泡利字符串项利用变换后的形式结合P(k)、P(j)和神经网络系数b_{kj}在经典计算机上算出该项的贡献。对所有泡利项求和得到总能量。这种方法的优势避免了在量子设备上制备和测量复杂的混合态|Ψ⟩。测量开销与传统的VQE方法如UCCSD处于同一量级约为O(N^4)次测量对于一般电子结构问题没有引入额外的指数级开销。大部分计算负载转移到了经典的神经网络前向传播和线性代数运算上充分利用了经典计算机的优势。4. 性能评估与实战分析理论再优美也需要用数据说话。我们通过数值模拟和真实硬件实验全面评估了pUNN的性能。4.1 数值精度基准测试我们在STO-3G基组下对一系列双原子和多原子分子BH₃, NH₃, CH₄, NH₄⁺, N₂, CO进行了无噪声模拟并以FCI结果为基准。分子HF误差 (Hartree)pUCCD误差 (Hartree)oo-pUCCD误差 (Hartree)UCCSD误差 (Hartree)pUNN误差 (Hartree)CCSD(T)误差 (Hartree)BH₃0.0850.0450.0200.00150.00080.0005N₂0.3800.1200.1180.00300.00120.0007CO0.3200.0950.0930.00250.00100.0006CH₄0.1800.0650.0280.00220.00180.0015平均绝对误差(MAE)0.2410.05190.0270.00190.00060.0004关键发现精度跃迁pUCCD的MAE为51.9毫哈特里而pUNN将其降低至0.6毫哈特里提升了近两个数量级。这直接证明了神经网络补全单占据构型的巨大威力。达到化学精度pUNN在所有测试分子上的误差都低于或接近1.6毫哈特里的化学精度阈值其精度与CCSD(T)和UCCSD这类高精度方法相当。超越轨道优化轨道优化的pUCCD (oo-pUCCD) 比标准pUCCD有改善但提升有限因为它依然受限于电子配对假设。而pUNN通过神经网络打破了这一限制。4.2 可扩展性与网络规模影响我们进一步研究了体系大小和神经网络规模对精度的影响。体系大小缩放以氢原子链H₅⁺, H₆, H₇⁺, H₈为例在两种键长1.0 Å和2.5 Å下测试。pUNN的误差随原子数增加增长缓慢且在长键长强关联区域依然保持高精度。而pUCCD在长键长下的误差急剧增大说明其无法处理强关联。神经网络规模我们调整了控制网络宽度的超参数K隐藏层神经元数2KN。结果显示随着K从2增加到8所有分子的计算误差呈对数下降趋势。对于NH₃和BH₃增大网络规模带来的精度提升尤为显著。这表明pUNN的表达能力可以通过增加经典计算资源神经网络参数来灵活调节以应对更复杂的体系。4.3 强关联体系挑战立方H₈分子立方H₈是一个经典的强关联测试模型当H-H距离d增大时电子关联性急剧增强。我们计算了其势能面。pUNN的表现在d从0.5 Å到2.5 Å的整个范围内pUNN计算的势能曲线与FCI结果高度吻合。CCSD的失效CCSD在d 1.5 Å后误差迅速增大且在更大d时无法收敛。这是因为CCSD基于单参考态在强关联区失效。其微扰修正CCSD(T)也无力回天。UCCSD的局限虽然UCCSD是变分方法理论上能处理强关联但在大d极限下也出现了显著误差这可能与优化困难或ansatz表达能力在有限深度下的限制有关。这个测试强有力地证明了pUNN框架在处理强关联问题上的潜力这是许多传统量子化学方法的痛点。4.4 超导量子计算机实战环丁二烯异构化理论模拟很完美但真实硬件充满噪声。我们在一个13比特的超导量子芯片上测试了pUNN对环丁二烯异构化反应势垒的计算。体系与设置选择cc-pVDZ基组并选取4个前线轨道作为活性空间。采用配对ansatz对应一个4比特的pUCCD电路。硬件编译与优化比特映射我们选择了芯片上具有环形拓扑的4个物理比特以最小化双比特门操作。门编译将Givens旋转门编译为芯片原生门如CNOT和单比特旋转。采用了前文提到的近似移除受控旋转门的控制位将每个Givens门所需的CNOT数从4个降至2个最终线路共8个CNOT门。误差缓解应用了基于直积校准矩阵的标准读出误差缓解。优化器使用专为量子电路优化的SOAP优化器来训练电路参数。工作流程每30步从量子电路采样一次每次测量1024 shots共进行15个宏迭代总计450步。神经网络使用AdaMax优化器训练。结果有噪声结果在量子硬件上pUNN预测的反应势垒约为16 kcal/mol。无噪声模拟在状态向量模拟器上pUNN预测的结果约为9 kcal/mol。对比分析实验值在2-10 kcal/mol之间。无噪声pUNN结果与FCI及实验观测吻合良好。硬件上的结果偏差主要源于量子门噪声和测量误差尽管电路很浅但噪声仍然存在。优化陷入局部极小在噪声影响下神经网络参数可能被困在非最优解。意义这个实验首次在真实量子硬件上验证了混合量子-神经波函数框架的可行性。虽然绝对精度因噪声而下降但其结果仍显著优于HF和MP2方法并与无噪声UCCSD预测值可比。这证明了该框架对噪声具有一定的鲁棒性。4.5 消融实验量子电路真的必要吗一个很自然的问题是既然神经网络这么强大我们能不能完全抛弃量子电路只用神经网络或者用一个简单的、可经典模拟的电路如所有比特加Hadamard门形成的均匀叠加态来提供采样我们做了这个对比实验见图7。用Hadamard叠加电路替代pUCCD电路后在环丁二烯过渡态体系上能量估计的准确性明显下降且方差不确定性大幅增加。原因在于对于大分子Hadamard电路产生的态是几乎所有可能构型的均匀叠加。其中绝大多数构型对真实基态的贡献微乎其微振幅接近零。用这样的态去训练神经网络来估计能量相当于在巨大的构型空间中“大海捞针”效率极低需要海量采样才能收敛。而pUCCD电路产生的态已经是一个包含了主要电子关联配对关联的“高质量先验分布”它更集中在那些对能量有重要贡献的构型区域。神经网络在此基础上进行修正相当于“精雕细琢”起点高收敛快效率高。这个实验有力地证明了在pUNN框架中量子电路并非可有可无的“装饰”而是提供了至关重要的、难以被经典高效生成的先验信息是提升整体算法效率和性能的关键组件。5. 常见问题、挑战与未来展望在实际操作和研究pUNN这类混合框架时会遇到一些典型问题和挑战。5.1 实操中的常见问题与排查训练不收敛或收敛至高能量可能原因神经网络初始化不当量子电路参数初始值离解太远优化器学习率设置不合适测量采样噪声过大在真实硬件上。排查技巧分阶段训练先固定量子参数用少量步骤预训练神经网络使其输出系数有一个合理的尺度。多随机种子始终用多个不同的随机种子初始化并运行完整训练选取能量最低的结果。学习率调度使用带热重启或余弦退火的学习率调度策略有助于跳出局部极小。增加测量次数Shots在硬件上如果能量方差过大尝试增加每次估计的测量次数以平滑噪声。能量估计方差大可能原因测量协议中某些泡利字符串项的期望值估计需要大量采样神经网络输出的系数b_{kj}在某些构型上变化剧烈。排查技巧重要性采样可以考虑根据当前波函数振幅|b_{kj}|²来调整对构型(k,j)的采样权重将更多测量资源分配给贡献大的构型。批次处理与并行将哈密顿量的不同泡利项分配到多个量子电路运行批次中并行执行缩短总体运行时间。神经网络训练速度慢可能原因网络过深或过宽每次前向传播都需要处理大量构型样本。排查技巧调整网络结构从较小的K如2开始逐步增加。深度LN-3是一个经验公式对于小体系可以尝试更浅的网络。小批量训练虽然能量估计依赖于整体分布但可以在神经网络参数更新时使用小批量样本估计梯度加速训练。使用更高效的网络论文中使用的是MLP作为概念验证。可以探索更高效的架构如限制玻尔兹曼机RBM、图神经网络GNN或注意力机制它们可能以更少的参数获得更好的表现。5.2 当前局限与挑战测量开销虽然测量协议很高效但总的测量次数仍与O(N^4)成正比对于大规模体系这仍然是主要开销。未来需要结合更先进的测量减少技术如经典阴影Classical Shadows或自适应测量策略。神经网络训练的经典成本对于非常大的体系N20神经网络参数量O(N^3)会变得可观其训练需要大量的经典计算资源。如何设计更轻量、更物理 informed 的网络结构是一个重要方向。误差累积与缓解在真实硬件上量子电路的噪声、测量误差会与神经网络的训练误差相互耦合。需要发展针对混合框架的专用误差缓解协议或许可以设计神经网络来主动学习并补偿特定的硬件误差模式。扩展到更大活性空间目前演示的体系活性空间在16比特以内。扩展到几十甚至上百个量子比特需要解决神经网络的可扩展性、测量方案的效率以及优化算法的稳定性等一系列问题。5.3 未来发展方向ansatz的多样化pUCCD是起点。未来可以探索将其他更强大或更物理的量子ansatz集成到此框架中例如基于价键理论的电路可能对强关联体系有更好的初始描述。与误差缓解深度集成将零噪声外推ZNE、概率误差消除PEC等技术与pUNN训练循环结合让神经网络在训练过程中直接学习到更接近无噪声情况下的能量面。应用于更复杂性质目前主要聚焦于基态能量。该框架可以扩展到计算激发态、分子力用于几何优化、偶极矩等其它电子性质。专用硬件协同设计随着量子硬件发展可以考虑设计更适合执行此类浅层量子电路、并与经典神经网络处理器高效交互的专用系统架构。pUNN框架为我们展示了一条在NISQ时代实现实用量子计算化学的清晰路径。它不追求用量子计算机解决所有问题而是让量子和经典计算各自做最擅长的事通过巧妙的算法设计将它们无缝融合。这种务实且高效的混合范式很可能是在通用容错量子计算机诞生之前我们探索量子优势最有希望的桥梁之一。