基于YOLOv8的手势识别系统：从数据准备到工程部署全流程实战-尧图网站建设

📅 发布时间：2026/7/5 17:33:16

🚀 30+款热门AI模型一站整合，DeepSeek/GLM/Qwen 随心用，限时 5 折。 👉 点击领海量免费额度

手势识别，这个听起来很“未来感”的技术，其实离我们并不遥远。从智能家居的隔空操控，到车载系统的非接触交互，再到AR/VR中的沉浸式体验，手势识别正悄然改变着我们与机器沟通的方式。然而，当一名开发者真正想动手实现一个手势识别系统时，往往会陷入迷茫：是选择传统的计算机视觉方法，还是拥抱深度学习？如果选深度学习，从数据准备、模型选择到部署落地，每一步似乎都充满了“坑”。

很多人以为，有了像YOLO这样的现成目标检测模型，手势识别就变成了简单的“调包”任务。但实际情况是，直接套用通用模型，在复杂光照、多变背景或快速移动的场景下，识别准确率往往惨不忍睹。一个真正可用、鲁棒的手势识别系统，其核心挑战远不止于模型本身，更在于如何理解业务场景、处理数据、设计流程以及进行工程化优化。

本文将围绕“基于深度学习的手势识别系统设计与实现”这一主题，为你拆解从零到一构建系统的完整路径。我不会只告诉你YOLOv8能检测手势，而是会深入探讨：为什么在这个场景下深度学习比传统方法更优？如何根据你的具体需求（是识别静态手势“OK”、“胜利”，还是动态手势如“滑动”、“抓取”）来设计整个技术栈？从数据采集标注的脏活累活，到模型选型、训练调参的“炼丹”过程，再到最后集成到Python应用或Web服务中的工程化实践，我都会结合代码和配置示例，一步步带你走通。

你会发现，构建一个手势识别系统，是一次绝佳的深度学习全流程实战。它不仅涉及计算机视觉和神经网络，还考验你的数据处理、软件工程和问题解决能力。读完本文，你将能清晰地回答：我的项目适合用手势识别吗？我需要准备什么？可能会遇到哪些“坑”？以及最重要的——如何开始动手。

1. 手势识别：为什么深度学习是当前的最优解？

在深入代码之前，我们必须先理清一个根本问题：为什么是深度学习？传统计算机视觉方法，如Haar特征、HOG（方向梯度直方图）结合SVM（支持向量机），在早期手势识别中曾被广泛应用。这些方法通过手工设计特征来捕捉手指的轮廓、手掌的形状等，其优势在于计算量小，在受限环境下（如固定背景、均匀光照）可以工作。

然而，传统方法的“阿喀琉斯之踵”在于其泛化能力。手工设计的特征难以应对现实世界的复杂性：光照的剧烈变化（从暗室到阳光直射）、背景的杂乱无章、手势的尺度与旋转变化、不同用户的肤色差异……每增加一个变量，都需要重新调整或设计特征，工程浩大且效果有限。

深度学习，特别是卷积神经网络（CNN），从根本上改变了这一范式。它不需要我们告诉计算机“什么是边缘”、“什么是纹理”，而是通过海量数据，让网络自动学习从原始像素到高级语义特征（如“握拳”、“张开五指”）的映射关系。这种数据驱动的方式带来了质的飞跃：

强大的泛化能力：一个在多样化数据集上训练好的模型，能够适应未曾见过的环境、光照和用户。
端到端学习：省去了繁琐的特征工程步骤，输入图像，直接输出识别结果。
高精度与鲁棒性：在复杂场景下，深度学习模型的识别准确率和稳定性远超传统方法。

对于手势识别任务，我们通常将其建模为一个目标检测或图像分类问题。

目标检测：不仅要识别出图像中是否有手势，还要定位手势所在的位置（用边界框标出）。这适用于需要知道手势在画面中具体位置的应用，如隔空点击屏幕某个按钮。YOLO系列、SSD、Faster R-CNN等是常用模型。
图像分类：假设图像中已经裁剪出只包含手势的区域，任务是对这个手势进行分类（如“点赞”、“暂停”）。这适用于手势区域已知或通过其他方式（如肤色分割）初步获取的场景。

从网络搜索材料来看，基于YOLO系列（v5, v6, v7, v8）构建的系统是当前的主流选择，因为它完美契合了“实时检测+定位”的需求，速度与精度平衡得较好。接下来，我们的设计和实现也将围绕这一技术路线展开。

2. 系统核心架构与模块设计

一个完整的、可工程化的手势识别系统，绝非一个孤立的模型文件。它应该是一个结构清晰、模块解耦的软件系统。下图展示了其核心架构：

[用户交互层] (UI/摄像头) | v [数据输入层] (图像/视频流捕获、预处理) | v [核心推理层] (深度学习模型加载、前向传播) | v [结果处理层] (后处理、边界框解码、非极大值抑制) | v [业务逻辑层] (手势语义映射、触发动作) | v [输出展示层] (可视化、日志、控制信号)

各模块职责详解：

数据输入层：负责从各种源（摄像头、视频文件、图片文件夹）稳定地获取图像帧。预处理是关键，通常包括尺寸缩放（如缩放到640x640以适配YOLO）、颜色空间转换（BGR转RGB）、以及归一化（像素值除以255）。这一步的效率直接影响系统整体帧率。
核心推理层：这是系统的“大脑”。它加载训练好的深度学习模型权重（如.pt或.onnx文件），并执行前向传播计算。这一层需要与深度学习框架（如PyTorch, TensorFlow）或专门的推理引擎（如ONNX Runtime, TensorRT）紧密集成，以追求极致的推理速度。
结果处理层：模型输出的通常是密集的预测张量，包含了大量重叠的、带有置信度的候选框。这一层需要解码这些张量，应用非极大值抑制（NMS）来剔除冗余框，最终得到清晰、唯一的检测结果（包括边界框坐标、类别标签、置信度）。
业务逻辑层：将检测到的“手势类别ID”转化为有意义的指令。例如，识别到“类别1（食指伸出）”可能映射为“鼠标左键点击”，识别到“向右挥手”可能触发“翻页”操作。这里可以设计简单规则，也可以引入状态机来处理连续手势序列（动态手势）。
输出展示层：将带有检测框和标签的图像实时显示在屏幕上，或将识别结果（如手势类型、坐标）通过API、Socket等方式发送给其他应用程序，完成闭环控制。

理解这个架构，有助于我们在开发时避免写出“意大利面条”式的代码，让数据流清晰，模块易于测试和替换。

3. 开发环境搭建与依赖安装

工欲善其事，必先利其器。一个稳定、一致的开发环境是项目成功的基石。以下配置以PyTorch和YOLOv8为例，这是当前社区最活跃、资料最丰富的组合。

基础环境要求：

操作系统：Ubuntu 20.04/22.04 LTS 或 Windows 10/11。Linux在深度学习开发中通常更少遇到环境问题。
Python：3.8 或 3.9（PyTorch对3.10+的支持可能需留意版本对应）。推荐使用conda或venv创建独立的虚拟环境。
CUDA（如使用NVIDIA GPU）：版本需与PyTorch版本匹配。例如，PyTorch 1.13可能对应CUDA 11.6/11.7。可通过nvidia-smi命令查看驱动支持的CUDA最高版本。

步骤1：创建并激活虚拟环境

# 使用 conda conda create -n gesture_recognition python=3.9 conda activate gesture_recognition # 或使用 venv python -m venv gesture_env # Linux/Mac source gesture_env/bin/activate # Windows gesture_env\Scripts\activate

步骤2：安装PyTorch及其依赖访问 PyTorch官网获取最适合你环境的安装命令。例如，对于CUDA 11.7：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

步骤3：安装YOLOv8及相关计算机视觉库Ultralytics YOLOv8 提供了极其友好的Python接口和命令行工具。

pip install ultralytics opencv-python pillow matplotlib seaborn tqdm # opencv-python 用于图像处理 # pillow 是图像处理库 # matplotlib 和 seaborn 用于可视化 # tqdm 用于显示进度条

验证安装：

import torch print(f"PyTorch version: {torch.__version__}") print(f"CUDA available: {torch.cuda.is_available()}") print(f"CUDA version: {torch.version.cuda}") from ultralytics import YOLO print("Ultralytics YOLO imported successfully.")

4. 数据：模型的“燃料”与处理管道

深度学习模型的表现，七分靠数据，三分靠调参。对于手势识别，数据环节至关重要。

4.1 数据收集

公开数据集：快速启动项目的首选。
- HaGRID (HAnd Gesture Recognition Image Dataset)：大规模数据集，包含18种手势类别，超过550k张图像，背景多样。
- EgoHands：专注于第一人称视角下的手部交互数据集。
- 11K Hands：包含11,000张图像，涵盖不同性别、年龄和肤色。
自定义采集：如果识别特定、自定义的手势（如公司LOGO手势），则需要自己采集。可使用手机、摄像头录制视频，然后抽帧。注意采集环境的多样性（光照、背景、角度、距离）。

4.2 数据标注标注是为图像中的手势画框并打上标签的过程。推荐使用LabelImg、CVAT或Roboflow等工具。

标注文件格式通常为YOLO格式（.txt文件）或PASCAL VOC格式（.xml文件）。YOLO格式更简洁，每行表示一个对象：<class_id> <x_center> <y_center> <width> <height>，坐标均为相对于图像宽高的归一化值（0-1之间）。
例如，一张640x480图片中，有一个手势框的左上角坐标为(100, 120)，宽高为(200, 160)，则：
- x_center = (100 + 200/2) / 640 = 0.234375
- y_center = (120 + 160/2) / 480 = 0.4166667
- width = 200 / 640 = 0.3125
- height = 160 / 480 = 0.3333333
- 如果class_id为0（代表“拳头”），则标注行内容为：0 0.234375 0.4166667 0.3125 0.3333333

4.3 数据集组织与YAML配置将数据按以下结构组织，并创建一个数据集配置文件（.yaml）：

gesture_dataset/ ├── train/ │ ├── images/ # 存放训练图片 │ │ ├── img1.jpg │ │ └── ... │ └── labels/ # 存放对应的YOLO格式标签文件 │ ├── img1.txt │ └── ... ├── val/ # 验证集，结构同train │ ├── images/ │ └── labels/ └── data.yaml # 数据集配置文件

data.yaml文件内容示例：

# data.yaml path: /path/to/gesture_dataset # 数据集根目录 train: train/images # 训练集图像路径（相对path） val: val/images # 验证集图像路径（相对path） # 类别数量 nc: 5 # 例如，我们定义5种手势 # 类别名称列表 names: ['fist', 'open_palm', 'pointing', 'ok', 'victory']

这个YAML文件是连接你的数据和YOLO训练脚本的桥梁。

5. 模型训练、验证与评估

有了高质量的数据，我们就可以开始“炼丹”了。YOLOv8大大简化了训练流程。

5.1 使用YOLOv8命令行快速训练

yolo task=detect mode=train model=yolov8n.pt data=/path/to/data.yaml epochs=100 imgsz=640 batch=16

task=detect: 指定任务为目标检测。
mode=train: 训练模式。
model=yolov8n.pt: 使用预训练的YOLOv8nano模型权重。还有s(small),m(medium),l(large),x(xlarge)等不同尺寸的模型，越大通常精度越高，但速度越慢。
data: 指向你的data.yaml文件。
epochs: 训练轮数。
imgsz: 输入图像尺寸。
batch: 批次大小，根据GPU内存调整。

训练开始后，Ultralytics会在runs/detect/train/目录下保存所有结果，包括：

最终模型权重（best.pt,last.pt）。
训练过程可视化图表（损失曲线、精度曲线）。
在验证集上的评估结果。

5.2 使用Python API进行更精细的控制如果你需要自定义训练循环、学习率调度器或数据增强策略，可以使用Python API：

from ultralytics import YOLO # 加载模型 model = YOLO('yolov8n.pt') # 加载预训练模型 # 或者从头开始训练: model = YOLO('yolov8n.yaml') # 训练模型 results = model.train( data='path/to/data.yaml', epochs=100, imgsz=640, batch=16, device='0', # 使用GPU 0， 'cpu' 为CPU workers=8, # 数据加载线程数 optimizer='AdamW', # 优化器 lr0=0.01, # 初始学习率 augment=True, # 启用自动数据增强 patience=50, # 早停耐心值 save=True, save_period=10, # 每10个epoch保存一次检查点 project='my_gesture_project', name='exp1' )

5.3 模型评估与指标解读训练完成后，使用验证集评估模型性能：

yolo task=detect mode=val model=runs/detect/train/weights/best.pt data=/path/to/data.yaml

关键评估指标：

mAP50 (Mean Average Precision at IoU=0.5)：最常用的目标检测指标。IoU（交并比）阈值设为0.5时的平均精度。值越高越好，0.5以上通常认为不错，0.7以上很好。
mAP50-95：在IoU阈值从0.5到0.95（步长0.05）区间内的平均mAP，是更严格的指标。
Precision (精确率)：模型预测为正的样本中，真正为正的比例。高精确率意味着误报少。
Recall (召回率)：所有真实为正的样本中，被模型正确预测出来的比例。高召回率意味着漏报少。
F1-Score：精确率和召回率的调和平均数，是综合衡量指标。

你需要根据应用场景权衡这些指标。例如，在医疗或安全关键应用中，可能要求极高的精确率（宁可漏报，不可误报）；而在信息检索中，可能更看重召回率。

6. 系统集成与实时推理代码实现

模型训练好之后，我们需要将其集成到一个可运行的应用程序中。下面是一个完整的、支持摄像头实时检测的Python脚本示例。

6.1 核心推理脚本创建一个文件，如gesture_detector.py：

import cv2 import argparse from ultralytics import YOLO import time class GestureRecognitionSystem: def __init__(self, model_path, conf_threshold=0.5, iou_threshold=0.45): """ 初始化手势识别系统 Args: model_path: 训练好的模型权重路径 (e.g., 'best.pt') conf_threshold: 置信度阈值，低于此值的预测将被过滤 iou_threshold: NMS的IoU阈值 """ # 加载模型 self.model = YOLO(model_path) self.conf_threshold = conf_threshold self.iou_threshold = iou_threshold # 定义手势类别名称 (应与data.yaml中的names一致) self.class_names = ['fist', 'open_palm', 'pointing', 'ok', 'victory'] # 用于计算FPS self.prev_time = 0 def process_frame(self, frame): """ 处理单帧图像，返回绘制了检测结果的图像和检测信息列表 """ # 执行推理 results = self.model(frame, conf=self.conf_threshold, iou=self.iou_threshold, verbose=False)[0] # 取第一个（也是唯一一个）结果 detections = [] annotated_frame = results.plot() # 使用Ultralytics内置方法绘制结果，非常方便 # 解析检测结果 if results.boxes is not None: boxes = results.boxes.xyxy.cpu().numpy() # 边界框 [x1, y1, x2, y2] confidences = results.boxes.conf.cpu().numpy() # 置信度 class_ids = results.boxes.cls.cpu().numpy().astype(int) # 类别ID for box, conf, cls_id in zip(boxes, confidences, class_ids): x1, y1, x2, y2 = map(int, box) label = f"{self.class_names[cls_id]} {conf:.2f}" detections.append({ 'bbox': (x1, y1, x2, y2), 'label': self.class_names[cls_id], 'confidence': conf, 'class_id': cls_id }) # 你也可以在此处自定义绘制，但results.plot()已经做了 # cv2.rectangle(frame, (x1, y1), (x2, y2), (0, 255, 0), 2) # cv2.putText(frame, label, (x1, y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0,255,0), 2) return annotated_frame, detections def calculate_fps(self): """计算并返回当前FPS""" current_time = time.time() fps = 1 / (current_time - self.prev_time) if self.prev_time > 0 else 0 self.prev_time = current_time return fps def run_realtime(self, source=0, window_name='Gesture Recognition'): """ 运行实时摄像头检测 Args: source: 摄像头ID（通常0为默认摄像头）或视频文件路径 window_name: 显示窗口名称 """ cap = cv2.VideoCapture(source) if not cap.isOpened(): print(f"Error: Could not open video source {source}") return print("Press 'q' to quit, 's' to save a screenshot.") while True: ret, frame = cap.read() if not ret: print("Failed to grab frame.") break # 处理帧 processed_frame, detections = self.process_frame(frame) # 计算并显示FPS fps = self.calculate_fps() cv2.putText(processed_frame, f"FPS: {fps:.1f}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 255), 2) # 显示结果 cv2.imshow(window_name, processed_frame) # 简单的业务逻辑：检测到特定手势时打印信息 for det in detections: if det['label'] == 'pointing' and det['confidence'] > 0.7: print(f"[Action] Pointing detected at {det['bbox']}") # 这里可以扩展更多手势触发的动作 # 键盘控制 key = cv2.waitKey(1) & 0xFF if key == ord('q'): break elif key == ord('s'): timestamp = time.strftime("%Y%m%d_%H%M%S") cv2.imwrite(f"screenshot_{timestamp}.jpg", processed_frame) print(f"Screenshot saved as screenshot_{timestamp}.jpg") cap.release() cv2.destroyAllWindows() if __name__ == "__main__": parser = argparse.ArgumentParser(description='Real-time Gesture Recognition using YOLOv8') parser.add_argument('--model', type=str, default='runs/detect/train/weights/best.pt', help='Path to the trained model weights') parser.add_argument('--source', type=str, default='0', help='Camera ID (e.g., 0) or video file path') parser.add_argument('--conf', type=float, default=0.5, help='Confidence threshold for detection') parser.add_argument('--iou', type=float, default=0.45, help='IOU threshold for NMS') args = parser.parse_args() # 初始化系统 system = GestureRecognitionSystem(args.model, args.conf, args.iou) # 运行实时检测 # 如果source是数字字符串，转换为整数（摄像头ID） source = int(args.source) if args.source.isdigit() else args.source system.run_realtime(source=source)

6.2 运行与测试在终端中运行你的脚本：

# 使用默认摄像头 python gesture_detector.py --model runs/detect/train/weights/best.pt # 使用视频文件 python gesture_detector.py --model runs/detect/train/weights/best.pt --source my_gesture_video.mp4 # 调整置信度阈值，减少误报（但可能增加漏报） python gesture_detector.py --model best.pt --conf 0.7

运行后，你将看到一个实时窗口，显示摄像头画面以及被识别出的手势边界框和标签。左上角会显示当前的FPS（帧率），这是评估系统实时性的关键指标。

7. 性能优化与部署考量

一个在实验室里跑通的模型，要变成真正可用的产品，还需要经过优化和工程化打磨。

7.1 模型优化技巧

模型轻量化：如果部署在资源受限的设备（如手机、嵌入式设备），考虑使用更小的模型（YOLOv8n, YOLOv8s）或进行模型剪枝、量化。
TensorRT加速：对于NVIDIA GPU部署，可以将PyTorch模型转换为TensorRT引擎，获得显著的推理速度提升。Ultralytics YOLOv8支持导出为ONNX，进而转换为TensorRT。
OpenVINO优化：对于Intel CPU或集成显卡，可以使用OpenVINO工具套件进行优化。
多尺度训练与测试：在训练时使用多尺度输入可以提升模型对不同大小目标的检测能力。YOLOv8训练参数中的imgsz可以是一个范围，如imgsz=[320, 640]。

7.2 工程化部署建议

Web服务化：使用FastAPI或Flask将模型封装成RESTful API，方便其他系统调用。

# FastAPI 示例片段 from fastapi import FastAPI, File, UploadFile from fastapi.responses import JSONResponse import cv2 import numpy as np app = FastAPI() detector = GestureRecognitionSystem('best.pt') # 初始化模型（全局加载一次） @app.post("/predict/") async def predict_gesture(file: UploadFile = File(...)): contents = await file.read() nparr = np.frombuffer(contents, np.uint8) img = cv2.imdecode(nparr, cv2.IMREAD_COLOR) _, detections = detector.process_frame(img) return JSONResponse(content={"detections": detections})

异步处理：对于视频流或批量图片处理，使用异步队列（如Celery + Redis）避免阻塞主线程。
模型版本管理：使用MLflow或DVC管理不同版本的模型、数据集和训练参数，确保实验可复现。
监控与日志：记录系统的推理延迟、准确率、资源使用情况，便于问题排查和性能分析。

8. 常见问题与排查指南

在开发过程中，你几乎一定会遇到下面这些问题。这里提供一份快速排查清单。

问题现象	可能原因	排查方式	解决方案
训练时Loss（损失）不下降或为NaN	学习率过高；数据标注错误（如坐标超出0-1范围）；数据中存在损坏的图像文件。	检查数据标注格式；可视化部分训练数据看标注框是否正确；使用更小的学习率（如`lr0=1e-4`）开始训练。	修正标注错误；删除损坏图像；使用`warmup_epochs`参数让学习率逐渐上升；使用梯度裁剪（`gradient_clip_val`）。
模型在验证集上mAP很低	过拟合（在训练集上表现好，验证集差）；数据分布不一致（训练集和验证集差异大）；类别不平衡。	检查训练和验证集的图像分布（光照、背景）；查看每个类别的AP（平均精度）。	增加数据增强（旋转、缩放、色彩抖动）；收集更多样化的数据；对少数类别进行过采样或使用类别权重。
实时检测FPS很低	模型太大（如YOLOv8x）；输入图像尺寸过大；未使用GPU推理；CPU性能瓶颈。	使用`torch.cuda.is_available()`确认GPU可用；在代码中打印每帧处理时间。	换用更小模型（YOLOv8n/s）；减小`imgsz`（如640->320）；确保`model.to(‘cuda’)`；使用TensorRT或ONNX Runtime加速。
检测框抖动（Jitter）严重	单帧检测置信度波动大；未使用任何跟踪算法。	观察连续帧中同一目标的置信度和位置变化。	提高置信度阈值`conf`；对检测结果应用卡尔曼滤波等简单跟踪；或集成专用跟踪器（如ByteTrack, BoT-SORT）。
特定手势识别不准	该手势训练数据不足；手势特征与其他手势相似度高（如“食指伸出”与“数字1”）。	查看混淆矩阵，看该手势最常被误分为哪一类。	针对性补充该手势的困难样本（不同角度、光照）；尝试修改模型结构（如增加注意力机制）或使用更强大的数据增强。
内存溢出（OOM）	批次大小（`batch`）或图像尺寸（`imgsz`）设置过大，超出GPU显存。	使用`nvidia-smi`监控GPU显存使用。	减小`batch`和`imgsz`；使用梯度累积（`accumulate`参数）模拟大批次。

9. 最佳实践与项目进阶方向

遵循以下最佳实践，能让你的手势识别项目更加稳健和可维护：

数据至上：投入至少60%的精力在数据上。确保数据质量高、标注一致、覆盖所有预期场景。建立一个持续的数据收集和清洗流程。
版本控制一切：使用Git管理代码，使用DVC或类似工具管理数据集和模型文件。记录每次实验的超参数和环境配置。
渐进式优化：不要一开始就追求最复杂的模型。从YOLOv8n开始，建立一个可以运行的基线系统。然后通过分析失败案例，有针对性地优化数据、模型或后处理。
设计可测试的接口：将核心的检测函数（如process_frame）与UI、业务逻辑分离，便于单元测试和模块替换。
考虑边缘部署：如果最终目标是嵌入式设备，尽早考虑模型量化、剪枝和特定硬件（如Jetson系列， Raspberry Pi + Intel神经计算棒）的适配。

进阶方向：

动态手势识别：本文主要关注静态手势（单帧图像）。要识别“滑动”、“画圈”等动态手势，需要引入时序模型，如RNN、LSTM或3D CNN，或使用基于关键点跟踪的方法（如MediaPipe Hands提取手部关键点序列，再用时序模型分类）。
多模态融合：结合深度摄像头（如Intel RealSense）的深度信息，可以更好地将手部与背景分离，提升复杂背景下的识别鲁棒性。
Few-Shot / Zero-Shot学习：当需要快速支持新手势而缺乏大量数据时，可以研究如何利用小样本学习或提示学习（Prompt Learning）技术。
端到端应用集成：将手势识别模块无缝集成到更大的应用系统中，如视频会议工具、智能驾驶舱、康复训练系统等，处理模块间的通信、状态同步和错误恢复。

构建一个健壮的手势识别系统，是一个典型的“端到端”机器学习工程问题。它要求你不仅理解深度学习模型，还要掌握数据工程、软件开发和系统集成的技能。从准备数据、训练模型，到写出第一行检测代码看到实时效果，这个过程充满挑战，但也极具成就感。希望这份详尽的指南能为你扫清障碍，让你能够将想法快速落地，打造出真正能理解人类手势的智能应用。

🚀 30+款热门AI模型一站整合，DeepSeek/GLM/Qwen 随心用，限时 5 折。 👉 点击领海量免费额度