数据获取
数据获取 见文章底部卡片获取!!!!!!!!!!!!!!数据集概览
数据集在计算机视觉任务中扮演着至关重要的角色,它们为模型提供了学习和理解世界的素材。Ultralytics 提供了广泛的数据集支持,旨在促进检测、实例分割、姿态估计、分类和多目标跟踪等任务的发展。本文将详细介绍 Ultralytics 支持的主要数据集,并探讨每个计算机视觉任务对应的特定数据集。
观看:Ultralytics 数据集概览
Ultralytics 曾经提供了一个名为 Explorer 的工具,用于探索和管理数据集。然而,截至 ultralytics>=8.3.10,Explorer 工具已被弃用。现在,用户可以通过Ultralytics Hub来进行无代码的数据管理和可视化工作。Ultralytics Hub 是一个直观的平台,它允许用户创建嵌入式搜索相似图像、运行 SQL 查询、执行语义搜索,甚至使用自然语言进行搜索。此外,用户还可以通过图形用户界面(GUI)应用程序或应用程序接口(API)来构建自己的应用。这些功能极大地简化了工作流程,让用户可以专注于数据分析和模型训练。
物体检测
物体检测是计算机视觉领域中最常见的任务之一,其目的是识别和定位图像中的物体。Ultralytics 支持多个物体检测数据集,涵盖了从城市环境到农业领域的广泛应用场景:
Argoverse:包含来自城市环境的三维跟踪和运动预测数据,具有丰富的注释。
COCO:Common Objects in Context (COCO) 是一个大型物体检测、分割和字幕数据集,包含 80 个物体类别。
LVIS:大规模物体检测、分割和字幕数据集,包含 1203 个物体类别。
COCO8 和 COCO128:COCO 数据集的小型子集,适合快速测试和实验。
全球小麦 2020:包含 2020 年全球小麦挑战赛的小麦头图像。
Object365:用于物体检测的高质量大规模数据集,包含 365 个物体类别和 600K 多张注释图像。
OpenImagesV7:由 Google 提供的综合数据集,包含 170 万张训练图像和 4.2 万张验证图像。
SKU-110K:零售环境中密集物体检测的数据集,包含超过 11K 幅图像和 170 万个边界框。
VisDrone:无人机捕获图像中的物体检测和多物体跟踪数据集,有超过 10K 幅图像和视频序列。
VOC:Pascal Visual Object Classes (VOC) 数据集,包含 20 个物体类别和超过 11K 幅图像。
xView:高空图像中物体检测的数据集,包含 60 个物体类别和 100 多万个注释物体。
RF100:多样化的物体检测基准,包含 100 个数据集,横跨 7 个图像领域,用于综合模型评估。
脑肿瘤:用于检测脑肿瘤的数据集,包括核磁共振成像或 CT 扫描图像。
非洲野生动物:非洲野生动物图像数据集,包括水牛、大象、犀牛和斑马。
签名:带有签名注释的各种文件图像数据集,支持文件验证和欺诈检测研究。
实例分割
实例分割不仅识别图像中的物体,还精确勾勒出每个物体的轮廓。Ultralytics 支持以下实例分割数据集:
- COCO:专为物体检测、分割和字幕任务设计的大型数据集,包含 20 多万张标注图像。
- COCO8-seg 和 COCO128-seg:COCO 数据集的较小子集,适用于快速测试实例分割任务。
- Crack-seg:专门用于检测道路和墙壁裂缝的数据集。
- Package-seg:为识别仓库或工业环境中的包裹而定制的数据集。
- Carparts-seg:专门用于识别汽车零部件的数据集,满足设计、制造和研究的需要。
姿态估计
姿态估计技术用于确定物体相对于摄像机或世界坐标系的姿态。以下是 Ultralytics 支持的姿态估计数据集:
- COCO:大规模人类姿势注释数据集。
- COCO8-pose:用于姿态估计任务的较小数据集,包含 8 幅 COCO 图像的子集。
- Tiger-pose:紧凑型老虎主题数据集,每只老虎有 12 个关键点。
- 手部关键点:包含 26,000 多张以人手为中心的图像,每只手有 21 个关键点。
- Dog-pose:包含约 6,000 张以狗为主题的图像,每只狗有 24 个关键点。
分类
图像分类任务涉及根据图像内容将其归入预定义的类别。以下是常用的分类数据集:
- Caltech 101 和 Caltech 256:分别包含 101 和 256 个对象类别的图像数据集。
- CIFAR-10 和 CIFAR-100:小型彩色图像数据集,分为 10 或 100 类。
- 时尚-MNIST:由 10 个时尚类别的 70,000 张灰度图像组成的数据集。
- ImageNet:大型数据集,包含超过 1,400 万张图像和 20,000 个类别。
- ImageNet-10 和 Imagenette:ImageNet 的较小子集,用于更快地进行实验。
- Imagewoof:更具挑战性的 ImageNet 子集,包含 10 个犬种类别。
- MNIST:由 70,000 幅手写数字灰度图像组成的数据集。
- MNIST160:MNIST 数据集中每个类别的前 8 幅图像,共包含 160 张图像。
定向边框(OBB)
定向包围盒(OBB)是一种利用旋转包围盒检测倾斜物体的方法,通常应用于航空和卫星图像。相关数据集包括:
- DOTA-v2:流行的 OBB 航空图像数据集,包含 170 万个实例和 11,268 幅图像。
- DOTA8:DOTAv1 分割集的较小子集,适合快速测试。
多目标跟踪
多目标跟踪涉及在视频序列中检测和跟踪多个目标。Ultralytics 支持以下多目标跟踪数据集:
- Argoverse:城市环境中的三维跟踪和运动预测数据。
- VisDrone:无人机捕获图像中的物体检测和多物体跟踪数据。
贡献新数据集
为了确保新数据集与现有基础设施的一致性,贡献者需要遵循一系列步骤:
- 收集图像:从公共数据库或个人收藏中收集图像。
- 注释图像:根据任务应用边界框、线段或关键点进行注释。
- 导出注释:将注释转换为 YOLO *.txt 格式。
- 整理数据集:按照 train/ 和 val/ 目录结构组织数据集,每个目录包含 images/ 和 labels/ 子目录。
- 创建 data.yaml 文件:描述数据集、类别和其他必要信息。
- 优化图像(可选):减小数据集大小以提高处理效率。
- 压缩数据集:将整个数据集文件夹压缩成 zip 文件。
- 文档和公关:创建文档页面并提交拉取请求 (PR)。
通过上述步骤,您可以确保提供的新数据集能够顺利整合到 Ultralytics 现有的结构中,从而为社区做出贡献。
优化和压缩数据集的示例代码
frompathlibimportPathfromultralytics.data.utilsimportcompress_one_imagefromultralytics.utils.downloadsimportzip_directory# Define dataset directorypath=Path("path/to/dataset")# Optimize images in dataset (optional)forfinpath.rglob("*.jpg"):compress_one_image(f)# Zip dataset into 'path/to/dataset.zip'zip_directory(path)常见问题
Ultralytics 支持哪些数据集进行物体检测?
Ultralytics 支持多种物体检测数据集,例如:
- COCO:大规模物体检测、分割和字幕数据集,包含 80 个物体类别。
- LVIS:包含 1203 个物体类别的广泛数据集。
- Argoverse:城市环境中的三维跟踪和运动预测数据。
- VisDrone:无人机拍摄的物体检测和多物体跟踪数据。
- SKU-110K:零售环境中密集物体检测的数据集。
这些数据集有助于为各种物体检测应用训练稳健的模型。
如何向 Ultralytics 提供新数据集?
提供新数据集涉及几个步骤,包括收集和注释图像、导出注释为 YOLO *.txt 格式、整理数据集结构、创建 data.yaml 文件、优化图像(可选)、压缩数据集以及提交文档和 PR。通过遵循这些指导方针,您能有效地为社区贡献新的资源。
综上所述,Ultralytics 提供了丰富多样的数据集,覆盖了广泛的计算机视觉任务。无论您是在进行物体检测、实例分割、姿态估计、分类还是多目标跟踪,都能找到合适的数据集来支持您的研究和开发工作。如果您有兴趣贡献新数据集或进一步了解 Ultralytics 的数据集,请参考官方指南和文档获取更多信息。
代码 数据获取
见文章底部获取联系方式!!!!!!!