尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

NeurIPS 2025|让AI读懂第一视角的“内心独白”!浙大等联合突破性实现自我中心视频推理

NeurIPS 2025|让AI读懂第一视角的“内心独白”!浙大等联合突破性实现自我中心视频推理
📅 发布时间:2026/6/19 14:45:11

NeurIPS 2025|让AI读懂第一视角的“内心独白”!浙大等联合突破性实现自我中心视频推理

论文名称:EgoThinker: Unveiling Egocentric Reasoning with Spatio-Temporal CoT

发布时间:2025年10月28日

👉一键直达论文

👉一键直达Github

👉Lab4AI大模型实验室论文阅读

✅此平台提供AI导读和翻译等工具,辅助论文阅读。

✨研究背景

现有多模态大语言模型擅长第三人称视觉理解,但缺乏第一人称(自我中心)视角的推理能力。自我中心视频的核心挑战在于推断摄像机佩戴者不可见的意图及其与环境的细粒度交互,这要求模型具备长时序因果推理和精确的时空定位能力。然而,当前主流数据集缺乏详细的推理链和手物交互标注,导致模型难以理解复杂的自我中心活动,限制了其在可穿戴助手和具身智能中的应用。

✨研究框架

EgoThinker的框架核心是数据驱动与两阶段训练。首先,我们构建了包含500万问答对的大规模数据集EgoRe-5M,其囊括了从短时感知到长时序因果推理的多种任务。基于此,模型先通过监督微调 学习基础的视频理解与推理能力;再通过基于规则奖励的强化微调,专门优化其在手物空间定位与时间区间定位上的精度,从而将高层推理与低层感知紧密结合。

✨核心贡献

本文的核心贡献包括三方面:

  • 提出EgoRe-5M数据集:这是一个包含丰富思维链与手物交互标注的大规模自我中心问答数据集,涵盖多样化的真实场景与任务类型,为自我中心推理研究提供了重要数据基础。
  • 设计两阶段训练范式:通过SFT+RFT的结合,显著提升了模型在时空定位与因果推理方面的能力,尤其在细粒度交互理解与长时序推理任务中表现突出。
  • 构建EgoThinker模型并在多个基准测试中取得SOTA性能:在EgoPlan、EgoSchema、VLN-QA等自我中心推理任务中显著优于现有模型,同时保持通用视频理解能力,展示了其在可穿戴AI与具身智能中的潜力。

相关新闻

  • 2025年燃气低氮热水锅炉加工厂权威推荐榜单:家庭燃气热水锅炉/立式卧式燃气热水锅炉/半吨燃气热水锅炉设备源头厂家精选
  • 08.入门篇-Java程序运行原理
  • 【水印检查】字符串处理和矩阵的存入

最新新闻

  • 2026西安2026正规漏水检测维修公司精选口碑榜TOP5权威推荐-精准定位检测漏水点-专业防水补漏堵漏维修、卫生间/厨房/屋顶/天沟/地下室/阳台防水漏水检测维修 - 安佳防水
  • 微信聊天记录永久保存终极指南:如何让珍贵对话永不丢失
  • MC9S12XE GPIO深度解析:从寄存器配置到中断实战
  • 2026襄阳2026正规漏水检测维修公司精选口碑榜TOP5权威推荐-精准定位检测漏水点-专业防水补漏堵漏维修、卫生间/厨房/屋顶/天沟/地下室/阳台防水漏水检测维修 - 安佳防水
  • 5步掌握FitGirl游戏启动器:高效管理压缩游戏的终极工具
  • 2026年西安评价高的玻璃门生产厂家哪家强 - 品牌鉴赏官2026

日新闻

  • 信任的进化:技术实现详解——如何用JavaScript构建博弈论模拟器
  • Terrakube自定义工作流:如何集成OPA、Infracost等工具扩展IaC能力
  • grunt-concurrent快速入门:5分钟学会并行运行Grunt任务

周新闻

  • 3步解锁iOS设备:applera1n激活锁绕过完全指南
  • 39 2026 人工智能证书终极盘点,普通人选 AI 证书可以从这些方向入手
  • Redis 暴露公网有多危险?从端口检查到补救步骤

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号