当前位置: 首页 > news >正文

TESSERA:打破遥感模型依赖「理想数据」瓶颈,低标注下优势显著

1. 新技术TESSERA的推出

剑桥大学、阿尔托大学、布里斯托大学的联合研究团队基于巴洛双子算法构建了一种新的时序特征学习范式,能让模型自主学习地表稳定的时空变化规律,形成具有时序采样不变性的遥感特征表示。在此基础上,研究团队进一步提出了面向哨兵一号/哨兵二号多模态时序数据的像素级遥感基础模型TESSERA。

2. 遥感数据面临的问题

对地观测卫星已成为农业生产、森林管护、生态监测、国土治理等领域的关键工具,研究人员可利用卫星获取的长时序遥感数据追踪地表动态变化。但真实的卫星观测数据存在诸多问题,如云层遮挡、轨道重访周期不规则、传感器分辨率不匹配、设备噪声等干扰,导致原始数据残缺、异构、无序,难以直接用于高精度智能分析。尤其在农业物候、短时生态扰动等精细场景中,云层会直接掩盖关键的变化过程。

3. 现有处理方法的不足

目前行业普遍采用影像合成技术来「去云」和降噪,生成标准化无云影像,这提升了数据质量和可用性,但也带来了明显的信息损耗,物候动态、短时突变等精细时序特征往往在合成过程中被弱化甚至抹除,导致部分关键信息流失。近年来,遥感基础模型通过大规模预训练取得了很大进展,但多数模型仍依赖经过深度过滤、规整后的理想数据,训练时只用无云合成影像或时序均值,这舍弃了大量虽受云层影响、却仍包含真实变化规律的观测数据,导致模型在实际业务中面对稀疏、残缺、云量复杂的时序数据时,特征提取不稳,泛化能力大打折扣。

4. TESSERA的构建与研究亮点

为打破瓶颈,联合研究团队基于巴洛双子(Barlow Twins)算法构建新的时序特征学习范式,不再过滤含云数据,而是约束同一位置不同观测子集之间的特征一致性,让模型自主学习地表稳定的时空变化规律,形成具有时序采样不变性的遥感特征表示,并在此基础上提出像素级遥感基础模型TESSERA。相关研究成果已发表于预印本平台arXiv。研究亮点如下:构建全球尺度、像素级、高标签利用率的特征嵌入,设计全新自监督架构,训练出融合哨兵一号/二号多模态数据的像素级遥感基础模型;推出符合FAIR准则的数据即嵌入方案,发布全球年度10米分辨率像素级8位整型特征嵌入数据集,提供可直接部署的合规遥感资源;实验发现,在多样化的分类、分割和回归任务中,TESSERA能以极高的标签效率达到SOTA精度,通常仅需一个轻量任务头和极少的计算量。

5. 数据体系构建

该研究构建了覆盖全球的大规模时序遥感数据体系,用于模型预训练和系统评估模型的泛化能力。整个数据体系由预训练数据集和下游评测数据集组成,均基于哨兵一号雷达数据和哨兵二号光学数据构建,充分发挥雷达与光学观测的互补优势。

6. TESSERA优化数据嵌入方案

预训练阶段,研究团队构建了一个全球尺度的大规模时序数据集,时间跨度覆盖2017年至2024年,空间范围涵盖全球三千余个网格瓦片,总计约8亿个d - pixel样本。该数据集尽可能保留了真实观测的原始特性,包括数据缺失、不规则采样和云层遮挡等情况,同时每个时间步均配套二值掩码,用于标记观测有效状态,使模型能够显式感知数据缺失与观测质量差异。下游评测阶段,研究团队选取了6项公开基准数据集,覆盖分类、分割和回归三类主流任务,评测区域涵盖德国、法国、奥地利、芬兰、马来西亚等多个国家和地区,覆盖农业、森林等典型应用场景。每类任务均同时包含大尺度区域数据集和精细化局部数据集,分别评估模型的跨区域迁移能力和细粒度特征建模能力。此外,针对当前高分辨率、多时相哨兵一号/二号多模态标注数据稀缺的问题,研究团队还自主构建了两个新的评测基准:一是奥地利地块级作物制图数据集,用于评估精细农业场景下的分类与分割能力;二是基于激光雷达校正构建的东南亚森林林冠高度数据集,用于验证森林结构参数反演任务中的表现。

7. TESSERA的设计目标与数据组织方式

TESSERA的设计目标是在尽可能保留原始观测信息的前提下,让模型直接从复杂、不完整的时序数据中学习稳定表征,减少对数据规整、补全和修复流程的依赖。为此,该研究提出了一种新的时序数据组织方式——d - pixel。传统分析通常以单景影像或固定时间序列为输入,而d - pixel以单个空间位置为核心,将同一像素在不同时间获取的多源观测按时间顺序组织成观测序列。每个d - pixel不仅包含哨兵二号光学信息和哨兵一号雷达信息,还通过掩码向量标识哪些时间步存在云遮挡或数据缺失。这种表示方式完整保留了地表变化的时序特征,避免了传统规整过程中的信息损失。

8. TESSERA整体处理流程

模型架构上,TESSERA采用双分支编码器,分别处理光学和雷达数据。两类数据的成像机制和物理属性存在明显差异,独立编码能够充分挖掘各自特征,再通过融合实现多模态互补。对每种模态,模型首先对有效观测进行嵌入表示,并加入可学习的年内日位置编码引入时间信息,然后通过Transformer编码器建模长时序依赖关系,最后利用门控循环单元聚合整条时间序列,生成固定维度的单模态表征。光学与雷达特征融合后,形成128维多模态地表表征。研究还引入量化感知训练,将最终特征压缩为8位整型,在几乎不损失精度的情况下将存储规模缩减约75%。预训练策略是TESSERA的核心创新。基于巴洛双子自监督学习框架,对同一个d - pixel,系统从其完整时间序列中随机抽取两组观测子集,构建两种不同的「视角」。尽管两组观测包含的时间点不同,甚至部分时间步存在缺失,但描述的是同一地表对象。训练过程中,模型被要求将这两组观测映射到尽可能一致的特征空间。通过这种方式,模型学习到的是隐藏在不同观测背后的稳定地表规律,从而获得对时间采样方式具有鲁棒性的特征表示。此外,研究还引入混合正则化与全局打乱策略,进一步提升模型对观测扰动和空间自相关性的鲁棒性。

9. TESSERA在低标注与稀疏数据下的优势

为全面评估TESSERA的性能,该研究围绕遥感领域的典型应用场景设计了系统化实验,从分类、分割和回归三类任务出发,验证模型在不同数据规模、标注条件和区域场景下的表现。实验选取了多种主流遥感基础模型和经典视觉模型作为基线,统一设置1%、30%和100%三种标注比例,重点考察标签稀缺场景下的学习能力。为保证比较公平,不同任务均采用轻量化适配器进行下游推理。分类任务中,TESSERA展现出显著的时序特征学习优势。无论是在国家尺度树种分类任务还是精细化作物分类任务中,模型均取得领先表现。尤其在仅使用1%标注数据的极低样本场景下,TESSERA仍保持稳定性能,分类精度较最优基线提升约8个百分点。分割任务中,TESSERA表现出优秀的空间细节刻画能力。面对大尺度农田地块分割任务,模型在全量标注条件下达到行业领先水平;在低标注场景下,性能进一步超越所有对照模型。在奥地利作物语义分割数据集上,模型生成的地块边界更清晰,不同作物之间的混淆显著减少,整体语义一致性更强。回归任务重点考察模型对连续地表参数的表征能力。在地上生物量估算任务中,TESSERA在不同标注比例下均取得最佳结果,预测误差更低,空间分布更连续。在森林林冠高度反演任务中,模型进一步展现出对三维森林结构信息的捕捉能力,估算结果与激光雷达实测数据吻合度最高,能够有效恢复森林垂直结构特征。综合所有实验结果,TESSERA在分类、分割和回归三类任务中均保持稳定优势,尤其在低标注、数据稀疏和观测缺失等复杂条件下优势更为明显。相比许多依赖高质量训练数据的模型,TESSERA在真实遥感场景中的性能下降更加平缓,展现出更强的鲁棒性和泛化能力。

10. 思考与方向

遥感基础模型真的非「理想数据」不可吗?TESSERA的尝试给出了不同的答案:让模型直接面对真实世界中残缺、不规则、云层干扰频繁的观测序列,在自监督框架下学习具有时序采样不变性的特征表示。这并不意味着数据清洗不再重要,而是提示研究人员或许可以将更多精力从「把数据变干净」转向「让模型学会处理不干净的数据」。毕竟,卫星拍下的每一张含云影像,都是地球真实观测的一部分。相比不断追求更「完美」的数据,让模型学会理解真实世界的复杂性,或许才是遥感基础模型走向通用化的重要方向。

http://www.rkmt.cn/news/1504957.html

相关文章:

  • 毕业设计 yolov11骨折检测医疗辅助系统(源码+论文)
  • 人事业务融合型系统协同能力评测:泛微・聚才林基准评估
  • GASDocumentation:虚幻引擎5能力系统实战解析与架构设计
  • 2026免费去水印工具推荐!在线/电脑/手机通用教程
  • 如何将单张插画智能转换为专业PSD分层文件:Layerdivider完全指南
  • 面向产出物的思维能力和 AI 交互
  • 大麦自动化抢票:从手动秒杀到技术降维打击的技术实现解析
  • 163MusicLyrics:免费歌词下载神器,轻松获取网易云QQ音乐歌词
  • 如何轻松让老旧Mac焕发新生:OpenCore Legacy Patcher完整指南
  • 智慧交通港澳地区车牌检测数据集VOC+YOLO格式4167张4类别
  • 2026国内留学教育实测封神!5款上海等地国际本科机构全国口碑出众受好评 - 十大品牌榜
  • foobox终极美化指南:三分钟打造你的专属音乐播放器
  • 2026商洛贵金属回收黄金回收白银回收铂金回收店铺怎么挑?5 家不压价线下实体店完整测评清单 + 商家联络方式 - 信誉隆金银铂奢回收
  • BibiGPT完整指南:从音视频理解到高效学习的5个核心突破
  • 鸿蒙原生应用实战(三):UI构建 — 首页与写日记页面开发全流程
  • 火绒安全软件
  • 【收藏级·2026版】AI Agent记忆技术演进全解析
  • Three.js 实战:用 Vue3 打造一个可交互的3D人体解剖查看器(含完整源码)
  • 在AI的帮助下理解spring的启动过程
  • 小米穿戴设备表盘设计:从零到一的视觉创作指南
  • htdemucs_6s音乐源分离:6秒完成六音轨精准分离的革命性工具
  • 沈阳高口碑黄金铂金回收白银回收实体老店排行 5 家靠谱门店电话地址全收录 - 诚金汇钻回收公司
  • COMSOL仿真揭秘:母线板温升下的电阻动态响应
  • 企业微信模板卡片消息实战:一个PHP代码示例搞定合同审批提醒(含版本兼容说明)
  • 从[特殊字符]到[特殊字符]:手把手教你用Python爬虫批量下载并分类所有Emoji图片(附代码)
  • OpenCore Simplify:重构黑苹果配置的技术哲学与工程实践
  • Windows下用FFmpeg sws_scale做RGB图像缩放+多图定位叠加的完整工程包
  • 2026深圳GEO优化公司推荐:昊客网络助力企业AI搜索时代抢占先机 - 猫头鹰AI推广
  • 用Python+Matplotlib可视化旋转曲面:从抛物线到双曲面的3D建模实战
  • 2026晋中贵金属回收黄金回收白银回收铂金回收店铺怎么挑?5 家不压价线下实体店完整测评清单 + 商家联络方式 - 信誉隆金银铂奢回收