当前位置：首页 > news >正文

Qiboml：无缝集成TensorFlow/PyTorch的混合量子-经典机器学习框架

news 2026/5/25 11:17:08

1. 项目概述为什么我们需要一个混合量子-经典机器学习框架如果你和我一样在过去几年里一直关注量子计算和机器学习的交叉领域你可能会感到一种熟悉的“割裂感”。一边是TensorFlow、PyTorch这些成熟、生态繁荣的经典机器学习框架它们提供了从数据加载、模型构建、自动求导到分布式训练的一站式解决方案。另一边是PennyLane、Qiskit、Cirq等量子计算框架它们专注于量子电路的构建、模拟和硬件执行。当你想把两者结合起来构建一个真正的“混合”模型——比如用一个参数化量子电路PQC作为神经网络中的一层——你会发现自己常常需要写大量的“胶水代码”。这些代码要负责把经典张量转换成量子门的旋转角度在经典的前向传播中插入量子电路的执行处理量子测量带来的随机性shot noise以及最头疼的如何计算这个混合模型的梯度是用参数偏移规则Parameter-Shift Rule还是用伴随微分法Adjoint Differentiation或者如果你的量子后端不支持自动微分你甚至需要自己手动实现这些梯度计算再小心翼翼地“注入”回PyTorch或TensorFlow的计算图中。这个过程不仅繁琐而且极易出错更别提在不同后端CPU模拟、GPU加速、真实量子硬件之间切换时代码往往需要推倒重来。这就是Qiboml要解决的核心痛点。它不是一个全新的、试图取代一切的框架而是一个精心设计的“编排器”Orchestrator。它的定位非常清晰基于成熟的Qibo量子计算栈为TensorFlow和PyTorch这两个主流ML框架提供原生、无缝的量子层接口。你可以把它想象成一个“量子-经典粘合剂”它让你能用写经典Keras层或PyTorch Module一样自然的方式去定义和训练一个量子模型。它的价值在于统一性和全栈控制。统一性体现在你用同一套高级APIQuantumModel定义模型就能在多种后端上运行从在本地CPU/GPU上进行精确的态矢量模拟到使用张量网络方法模拟更大规模的系统再到最终部署在云端或本地的真实量子处理单元QPU上。全栈控制则意味着从高层的模型定义到脉冲级别的硬件调度、实时校准和误差缓解你都可以在一个开源软件栈内完成端到端的实验。这对于严肃的研究和工程化尝试至关重要因为它保证了工作流的可复现性和可控性。2. 核心设计哲学透明集成与后端无关性Qiboml的设计哲学可以概括为两点对ML框架透明对量子后端抽象。2.1 如何实现对ML框架的“透明”集成所谓“透明”是指量子模型在TensorFlow或PyTorch的眼中行为应该和一个标准的Dense层或Linear模块完全一致。Qiboml通过继承这两个框架的基础类tf.keras.Model或torch.nn.Module来实现这一点。你定义的QuantumModel对象其参数即量子电路中的可调角度会自动被框架的优化器识别和管理。在前向传播forward/call时它内部会调用Qibo后端来执行量子电路并解码测量结果在反向传播时它会利用集成的微分引擎可能是框架原生的自动微分也可能是参数偏移规则等来计算梯度并让这些梯度自然地流入经典部分的计算图中。这意味着你可以把QuantumModel实例当作一个普通的层和Conv2D、LSTM等层任意堆叠、连接。你的训练循环、学习率调度、早停策略、模型保存/加载全部可以使用经典ML框架中原生的工具链学习成本极低。2.2 后端无关性一套代码多种执行模式后端无关性是Qiboml另一个强大的特性。它通过一个抽象的Backend接口将量子计算的具体执行细节隐藏起来。你的模型代码只需要关心“电路结构”和“解码方式”而无需关心它最终在哪里运行。模拟后端态矢量模拟在CPU/GPU上进行精确的全振幅模拟适用于小规模系统通常30个量子比特的快速原型设计和算法验证。Qiboml集成了基于JAX的高性能模拟后端支持即时编译JIT和自动向量化vmap能极大加速批量电路的计算。张量网络模拟对于中等规模如30-100个量子比特且具有特定纠缠结构的电路全振幅模拟的内存开销会变得不可承受。Qiboml通过集成Quimb库支持将量子电路表示为矩阵乘积态MPS等张量网络进行近似但高效的模拟这是探索更大规模量子算法威力的关键。含噪声模拟你可以轻松地为模拟器注入噪声模型如退极化噪声、比特翻转、相位翻转等在部署到真实硬件前提前评估算法的噪声鲁棒性。硬件后端通过Qibo的中间件层QibolabQiboml可以直接控制自托管的超导、离子阱等量子硬件。这不仅仅是提交一个电路然后等待结果而是包括了脉冲级别的调度、实时校准如重测T1时间、单比特门保真度等底层控制能力。这对于进行需要与硬件深度交互的“硬件在环”Hardware-in-the-loop研究至关重要。一个关键的设计是CircuitTracer。这个组件负责在幕后追踪模型的高级结构。在前向传播过程中它会记录所有对模型参数和输入数据的操作从而构建出完整的量子电路。更重要的是它能提供量子电路旋转角度相对于模型参数和输入的雅可比矩阵Jacobian。这些雅可比矩阵可以与自定义微分引擎见下文提供的梯度链式结合最终得到损失函数相对于所有模型参数的完整梯度。CircuitTracer确保了经典参数和量子参数始终保持同步并且无论你切换哪种微分引擎高层模型定义都无需修改。3. 核心模块深度解析与实操理解了设计哲学我们深入到代码层面看看如何用Qiboml构建一个真正的混合模型。我们将以一个简单的量子神经网络QNN用于回归任务为例贯穿整个流程。3.1 模型构建块编码器、Ansatz与解码器Qiboml的qiboml.models模块提供了构建量子模型的核心乐高积木。1. 编码器将经典数据映射到量子态编码器负责将输入的经典数据一个浮点数向量转化为量子电路上的操作。最常用的编码方式是角度编码PhaseEncoding它将每个数据特征映射为一个量子比特的旋转门如RX, RY, RZ的角度。from qiboml.models.encoding import PhaseEncoding import numpy as np # 假设我们有4个特征的数据点 n_qubits 4 encoder PhaseEncoding(n_qubits) # 模拟一个数据点 data_point np.random.randn(n_qubits) # encoder会内部将data_point的每个元素作为角度应用到每个量子比特的RY门上。 # 例如对于第i个量子比特添加一个 RY(i, thetadata_point[i]) 门。为什么选择相位编码因为它简单、通用且对于许多问题如学习周期函数是自然的选择。当然你也可以实现更复杂的编码策略比如振幅编码将数据编码为量子态的振幅但这需要指数级的量子比特目前不实用。Qiboml允许你通过继承QuantumEncoding基类并重写__call__方法来定义任何自定义编码器。2. Ansatz可训练的量子电路块Ansatz是模型的核心它由一系列参数化的量子门组成这些参数将在训练中被优化。Ansatz的设计直接决定了模型的表现力和可训练性。Qiboml提供了一些预设的Ansatz如硬件高效型HardwareEfficient它由单比特旋转层和纠缠层如CNOT门交替组成旨在减少在真实硬件上的深度和错误。from qiboml.models.ansatze import HardwareEfficient from qibo import Circuit, gates n_qubits 4 n_layers 2 # 使用预设的硬件高效Ansatz ansatz HardwareEfficient(n_qubits, n_layersn_layers) # 或者手动构建一个自定义Ansatz custom_ansatz Circuit(n_qubits) for l in range(n_layers): # 单比特旋转层 for q in range(n_qubits): custom_ansatz.add(gates.RY(q, theta0.0)) # theta是待训练参数 custom_ansatz.add(gates.RZ(q, theta0.0)) # 纠缠层线性排列的CNOT门 for q in range(n_qubits - 1): custom_ansatz.add(gates.CNOT(q, q1))Ansatz设计的考量硬件高效型Ansatz的优点是门集简单与许多量子硬件原生支持的门集接近但可能表达能力有限且容易遇到“贫瘠高原”Barren Plateaus问题即梯度随量子比特数指数衰减。其他Ansatz如哈密顿量变分AnsatzHVA针对特定问题有更好的归纳偏置。选择哪种需要根据具体问题和硬件约束来权衡。3. 解码器从量子测量中提取经典信息执行完电路后我们需要测量量子态并将其转换为一个经典的、可微分的标量或向量以便计算损失。最常见的解码器是Expectation它计算某个可观测量如Pauli-Z算符的期望值。from qiboml.models.decoding import Expectation from qibo.hamiltonians import Z n_qubits 4 # 计算所有量子比特上Z算符的期望值之和 observable sum(Z(i) for i in range(n_qubits)) decoder Expectation(n_qubits, observableobservable) # 或者更简单地使用默认的Z算符 decoder Expectation(n_qubits) # 默认计算 sum_i Z_i 的期望值另一个有用的解码器是Probabilities它返回测量计算基态的概率分布可以用于分类任务。同样你可以通过继承QuantumDecoding基类来创建自定义解码器。3.2 组装与训练以PyTorch接口为例现在我们把积木搭起来并用PyTorch进行训练。import torch import torch.nn as nn from qiboml.interfaces.pytorch import QuantumModel from qibo import set_backend # 1. 设置后端例如使用JAX加速的CPU模拟 set_backend(jax) # 2. 定义模型组件 n_qubits 4 encoder PhaseEncoding(n_qubits) ansatz HardwareEfficient(n_qubits, n_layers3) decoder Expectation(n_qubits) # 输出一个标量 # 3. 构建电路结构列表这定义了数据流经量子部分的顺序 circuit_structure [encoder, ansatz] # 先编码数据再经过可训练电路 # 4. 实例化量子模型它现在是一个torch.nn.Module quantum_layer QuantumModel(circuit_structurecircuit_structure, decodingdecoder) # 5. 构建一个简单的经典-量子混合模型 class HybridModel(nn.Module): def __init__(self, input_dim, n_qubits): super().__init__() self.classical_preprocessor nn.Linear(input_dim, n_qubits) # 将任意维度输入映射到量子比特数 self.quantum_layer quantum_layer self.classical_postprocessor nn.Linear(1, 1) # 对量子层的输出做后处理 def forward(self, x): x torch.relu(self.classical_preprocessor(x)) # 将经典数据送入量子层量子层内部会调用编码器 x self.quantum_layer(x) # x的形状应为 (batch_size, n_qubits) x self.classical_postprocessor(x) return x # 6. 准备数据和训练循环标准的PyTorch流程 model HybridModel(input_dim10, n_qubits4) optimizer torch.optim.Adam(model.parameters(), lr0.01) loss_fn nn.MSELoss() for epoch in range(100): for data, target in dataloader: optimizer.zero_grad() output model(data) loss loss_fn(output, target) loss.backward() # 梯度会通过量子层一直反向传播到经典层 optimizer.step() print(fEpoch {epoch}, Loss: {loss.item():.4f})关键点注意quantum_layer(x)的调用。x是一个形状为(batch_size, n_qubits)的张量。PhaseEncoding编码器会为批次中的每个样本分别用其对应的n_qubits个特征值来设置旋转门角度。这意味着Qiboml原生支持批处理这对于与深度学习框架高效集成至关重要。3.3 微分引擎如何计算量子电路的梯度这是混合机器学习中最技术性的部分之一。Qiboml提供了多种梯度计算策略以适应不同的后端和精度要求。框架原生自动微分当使用jax或tensorflow后端进行精确的态矢量模拟时整个量子电路的执行包括最终的期望值计算可以被框架的自动微分系统如JAX的grad直接追踪。这是最方便、最精确的方式但仅限于无噪声模拟。参数偏移规则这是一种硬件友好的梯度计算方法。对于参数化的量子门如RY(theta)其期望值关于参数theta的导数可以通过在theta /- pi/2两个点重新计算期望值来得到。这种方法即使在有shot noise有限次测量的情况下也适用是当前在真实量子硬件上训练变分量子算法的主流方法。Qiboml内置了PSR实现。伴随微分法这是一种在模拟中更高效的计算梯度的方法特别是对于含有很多参数的电路。它通过一次前向传播和一次反向传播来计算所有参数的梯度计算复杂度与电路深度成正比而不是参数数量。Qiboml在模拟后端中也提供了此选项。如何选择一个简单的经验法则是在无噪声模拟中追求速度和精度使用框架原生自动微分JAX/TensorFlow。在有shot noise的模拟或计划最终在真实硬件上运行时使用参数偏移规则。对于参数极多的大型模拟电路可以尝试伴随微分法看是否能加速。在代码中你通常不需要显式指定Qiboml的接口会根据你设置的backend和decoder的配置如是否设置nshots自动选择最合适的微分策略。CircuitTracer会确保无论采用哪种策略梯度都能正确注入到PyTorch/TensorFlow的计算图中。4. 应对现实挑战噪声、误差缓解与硬件校准任何计划在近期量子设备上运行的算法都必须严肃对待噪声和误差。Qiboml在这方面提供了强大的内置支持。4.1 噪声建模与模拟在将模型部署到真实硬件之前在模拟器中加入噪声进行测试是必不可少的。Qiboml通过Qibo的噪声模块可以轻松实现。from qibo.noise import NoiseModel, PauliError from qiboml.models.decoding import Expectation # 1. 构建一个噪声模型 noise_model NoiseModel() # 在每个量子比特的每个门之后以1%的概率随机施加一个X, Y或Z错误 for q in range(n_qubits): noise_model.add( PauliError([(X, 0.01), (Y, 0.01), (Z, 0.01)]), gates[gates.RY, gates.RZ, gates.CNOT], # 指定受影响的 gate 类型 qubitsq ) # 2. 在解码器中启用噪声模拟 decoder Expectation( nqubitsn_qubits, density_matrixTrue, # 启用密度矩阵模拟以处理噪声 nshots1024, # 使用有限次测量 noise_modelnoise_model )密度矩阵模拟当存在噪声时量子态不再是纯态需要用密度矩阵来描述。启用density_matrixTrue会切换模拟模式这会增加计算开销内存消耗从O(2^n)变为O(4^n)但对于小规模系统的噪声评估是可行的。4.2 实时误差缓解量子误差缓解是一系列在不对量子比特进行主动纠错的情况下通过后处理来部分抵消噪声影响的技术。Qiboml集成了数据驱动的误差缓解方法如Clifford数据回归。其核心思想是运行一组与目标电路结构相同、但部分门被替换为Clifford门的“训练电路”。由于Clifford门可以高效经典模拟我们可以得到它们无噪声的精确期望值。同时我们在有噪声的模拟器或真实硬件上运行这些电路得到有噪声的期望值。然后用一个简单的线性或多项式模型来拟合“有噪声值”到“无噪声值”的映射关系。最后用这个学到的映射来校正我们目标电路的有噪声输出。Qiboml的妙处在于它可以将这个过程自动化并嵌入到训练循环中。mitigation_config { min_iterations: 500, # 至少计算500个期望值后才检查缓存的缓解映射是否过期 threshold: 0.05, # 如果参考电路 mitigated/未mitigated 值差异超过5%则更新映射 method: CDR, # 使用 Clifford Data Regression 方法 method_kwargs: { n_training_samples: 50, # 用于构建映射的 Clifford 电路数量 nshots: 10000 # 每个电路测量的次数 } } decoder Expectation( nqubitsn_qubits, nshots1024, noise_modelnoise_model, mitigation_configmitigation_config # 传入配置 )在训练过程中Mitigator对象会周期性地根据min_iterations和threshold在后台重新计算误差缓解映射。这意味着即使硬件的噪声特性在长时间训练中发生漂移缓解策略也能在一定程度上自适应。如图5所示在存在噪声和shot noise的情况下红色曲线严重偏离目标启用实时误差缓解黄色曲线能显著提升模型性能使其更接近无噪声模拟蓝色和绿色曲线的结果。4.3 硬件在环与校准感知训练当代码最终运行在真实硬件上时除了固有的门错误和测量错误还会遇到校准参数漂移的问题。例如量子比特的频率、相干时间T1, T2*、单比特门和两比特门的保真度都会随着时间几小时到几天和环境变化而缓慢改变。Qiboml通过Calibrator对象与QibocalQibo的校准子模块集成使得在训练过程中监控硬件状态成为可能。from qiboml.support import Calibrator from qibocal.protocols import RandomizedBenchmarking, ReadoutClassification # 1. 定义校准器并指定要运行的协议 calibrator Calibrator() # 每100次训练迭代运行一次随机基准测试来估计单比特门保真度 calibrator.add_protocol(RandomizedBenchmarking(qubits[0,1,2]), frequency100) # 每50次迭代运行一次读出分类来估计读出保真度 calibrator.add_protocol(ReadoutClassification(qubits[0,1,2]), frequency50) # 2. 将校准器关联到解码器通常在配置真实硬件后端时 decoder Expectation( nqubitsn_qubits, nshots1024, calibratorcalibrator )在训练循环中Calibrator会在指定的频率触发校准实验。这些实验的结果如图7中的插图所示展示了T1、读出保真度和门保真度在训练过程中的变化可以用于多种目的早期停止如果某个关键指标如门保真度低于阈值可以暂停训练避免在硬件状态不佳时浪费资源。触发重新校准如果检测到显著漂移可以自动或手动触发全面的重新校准流程。数据记录为分析训练性能与硬件状态的相关性提供宝贵数据。这种“校准感知”的训练模式是走向稳健、实用的量子机器学习的关键一步。5. 高级应用与性能考量5.1 混合量子-经典模型案例等变量子图神经网络论文中展示了一个在高能物理HEP中用于“喷注标记”任务的混合模型。这是一个绝佳的案例说明了如何将量子组件巧妙地嵌入到具有强烈归纳偏置的经典架构中。问题背景在粒子对撞实验中产生的夸克和胶子会经过“部分子簇射”和“强子化”形成一簇粒子流称为“喷注”。区分一个喷注来源于夸克还是胶子是一个重要的分类问题。由于物理定律的洛伦兹不变性分类器应该对参考系的变化具有不变性。模型架构作者构建了一个等变量子图神经网络。其核心思想是将每个喷注表示为一个点云每个点是一个粒子的四动量等信息。使用一个图神经网络GNN来处理这个点云。GNN的消息传递和聚合操作天然适合处理这种不规则结构数据。关键的创新在于消息传递函数φ_x见原文公式2由一个小型参数化量子电路来实现。这个PQC以粒子间洛伦兹不变量为输入经过经典预处理输出一个标量权重。整个架构的其余部分如节点更新、图级读出仍由经典MLP完成。为什么这么做量子电路在这里扮演了一个可学习的、可能具有量子优势的对称性保持函数的角色。理论保证使用等变不变网络可以通过在轨道代表元组成的缩减子空间上学习获得更好的泛化界限。将PQC嵌入到等变架构中是探索量子机器学习在具有对称性的实际问题中价值的前沿方向。在Qiboml中的实现要点实现这样的模型需要将QuantumModel作为一个自定义层嵌入到PyTorch Geometric或自己实现的GNN消息传递函数中。Qiboml的QuantumModel与PyTorch的无缝兼容性使得这种集成变得非常直接。梯度可以通过整个量子-经典混合模型反向传播实现端到端的训练。5.2 性能基准与扩展性Qiboml论文中将其与PennyLane、TensorFlow Quantum等框架进行了性能对比。基准测试通常关注两个方面电路模拟速度对于纯模拟任务Qiboml依托于Qibo的高性能后端特别是JAX在CPU/GPU上的态矢量模拟具有竞争力。对于更大规模的电路其张量网络后端基于Quimb提供了另一种扩展途径。训练开销与集成度Qiboml的核心优势在于其与经典ML框架的深度集成带来的便利性和代码简洁度。对于混合模型训练特别是需要频繁在经典和量子部分之间切换、计算梯度的场景Qiboml的抽象减少了大量的样板代码。关于扩展性的实践建议从小规模开始始终先在小型系统10个量子比特的无噪声模拟器上验证你的算法和模型架构。使用框架原生自动微分快速迭代。渐进引入复杂性确认模型工作后逐步引入shot noise设置nshots和简单的噪声模型观察性能下降情况。利用误差缓解在噪声模拟或向真实硬件过渡时务必启用mitigation_config。从CDR开始n_training_samples可以从小值如20-50开始尝试在效果和开销间取得平衡。监控硬件状态在真实硬件上运行时一定要使用Calibrator。设定合理的校准频率避免过于频繁拖慢训练或过于稀疏硬件已漂移却不知情。张量网络的适用场景当你的电路具有一维链状或低纠缠度的结构时可以尝试切换到张量网络后端backend”qibojit”并配置使用MPS这可以让你模拟多达50-100个量子比特的电路但要注意并非所有类型的量子电路都适合用张量网络高效表示。6. 常见问题、排查与实战心得在实际使用Qiboml进行研究和开发的过程中我总结了一些常见的问题和解决思路。6.1 安装与环境配置问题安装Qiboml或其依赖特别是带GPU支持的Qibo后端时遇编译错误或版本冲突。解决优先使用Conda环境创建一个新的Conda环境来管理依赖是避免冲突的最佳实践。conda create -n qiboml_env python3.10 conda activate qiboml_env从源码安装Qibo对于最新的功能或特定的硬件支持从GitHub源码安装Qibo和Qiboml通常比PyPI更可靠。pip install githttps://github.com/qiboteam/qibo pip install githttps://github.com/qiboteam/qibomlGPU支持如果需要CUDA支持确保先安装正确版本的jaxlib和jax。# 根据你的CUDA版本选择例如CUDA 12.4 pip install --upgrade jax[cuda12_pip] -f https://storage.googleapis.com/jax-releases/jax_cuda_releases.html6.2 梯度消失贫瘠高原问题训练时损失函数不下降梯度检查发现梯度值非常接近于零尤其是当量子比特数较多或电路较深时。分析与解决这是变分量子算法中著名的“贫瘠高原”现象。初步诊断在训练初期打印出量子层参数的梯度范数。如果发现其数量级极小如1e-10以下很可能遇到了贫瘠高原。策略调整改变Ansatz尝试使用更局部的、纠缠不那么强烈的Ansatz例如仅让相邻量子比特纠缠。初始化策略避免将所有参数初始化为零或相同的值。使用随机的小值初始化如从Uniform(-0.01, 0.01)中采样。分层训练先训练浅层电路稳定后再逐步增加层数。使用Identity初始化设计Ansatz使初始参数对应的电路近似于恒等门这有时能提供一个更好的起点。考虑经典预处理如问题允许用经典神经网络先对数据进行预处理降低量子部分的拟合负担。这正是混合模型的优势所在。6.3 真实硬件执行失败问题代码在模拟器上运行良好但切换到真实硬件后端backend”qibolab”时失败报错涉及门集、拓扑结构或脉冲。排查步骤检查门集真实芯片通常只支持一组有限的“原生门”。你需要定义一个Transpiler将你电路中的通用门如RX,RY,CNOT编译分解成硬件原生门如RZ,X/2,CZ等。Qibo的transpiler模块提供了Unroller等工具。from qibo.transpiler import NativeGates, Passes, Unroller from qibo.gates import RZ, X, CZ # 假设硬件原生门是RZ, X, CZ native_gates NativeGates.from_list([RZ, X, CZ]) transpiler Passes(passes[Unroller(native_gates)]) # 在创建decoder时传入transpiler decoder Expectation(..., transpilertranspiler)检查拓扑结构芯片上的量子比特并非全连接。你需要在transpiler中指定可用的连接关系编译器会自动插入SWAP门来实现逻辑连接。connectivity [(0, 1), (1, 2), (2, 3)] # 线性链 transpiler Passes(connectivityconnectivity, passes[Unroller(native_gates)])检查脉冲与校准确保Qibolab已正确配置能够连接到你的硬件控制服务器。运行简单的校准协议如Rabi振荡实验来验证基本功能是否正常。6.4 误差缓解效果不彰或开销过大问题启用了CDR等误差缓解但模型性能提升不明显或者训练速度变得极慢。调试检查缓解映射质量在训练开始前和每次更新映射后手动检查一下用于构建映射的“训练电路”的 mitigated 值和 exact 值的相关性。如果相关性本身就很低说明噪声模型太复杂或CDR方法不适合当前电路/噪声类型。调整mitigation_config参数增加n_training_samples更多的Clifford训练电路能产生更准确的映射但会增加开销。可以尝试从50逐步增加到200。调整threshold如果threshold设得太低会导致映射频繁更新拖慢训练。如果设得太高映射可能早已过时却未更新。观察训练日志中映射更新的频率将其调整到一个合理的水平例如每几千次迭代更新一次。尝试其他方法Qibo可能还实现了零噪声外推ZNE等其他误差缓解方法。对于某些类型的噪声ZNE可能比CDR更有效。权衡利弊误差缓解不是免费的。它引入了额外的电路执行开销。对于非常深的电路或需要大量shot的任务这个开销可能无法承受。此时或许应该优先考虑设计更浅、更抗噪声的电路或者接受在噪声下训练并依赖经典部分的鲁棒性。6.5 内存不足OOM问题问题在GPU上进行态矢量模拟时遇到内存不足错误。解决减少批量大小这是最直接的方法。态矢量模拟的内存消耗随量子比特数指数增长。对于n个量子比特一个态矢量需要2^n * complex128字节。n30时约16GBn31就翻倍到32GB。大批次会线性增加内存消耗。使用张量网络后端如果电路纠缠不强切换到MPS模拟可以极大地节省内存允许模拟更多量子比特。使用CPU模拟GPU内存通常比系统内存小。如果模型不是极大有时使用多核CPU模拟backend”numpy”并利用并行化可能比GPU更稳定。检查梯度计算模式在某些框架中默认会为反向传播保存所有中间变量。如果使用参数偏移规则确保没有无意中在模拟模式下保存了完整的计算图。最后一点个人体会量子机器学习目前仍处于“探索假设空间”的阶段。Qiboml这样的工具其最大价值在于极大地降低了探索的门槛和提高了实验的迭代速度。它让你能快速地将一个想法从公式、到无噪声模拟、到含噪声模拟、再到真实硬件上进行测试。在这个过程中保持耐心从小处着手充分利用其与经典生态集成的优势让量子组件专注于它可能最擅长的部分例如学习复杂的周期函数、利用纠缠进行特征映射是取得进展的关键。这个领域正在快速发展而拥有一个像Qiboml这样设计良好的全栈工具无疑能让你在探索中占据先机。

查看全文

http://www.rkmt.cn/news/1377858.html