当前位置: 首页 > news >正文

从Remy到3D空间影像壁纸,鸿蒙3DGS的差异性体验,凭什么得到消费者的认可?

在香港酒店的河边跑步了10km,已经很晚,思绪很多,但想提笔写点什么。

最近鸿蒙6.1推出了3D空间影像壁纸,在小红书和抖音上非常火爆,消费者很喜欢,尤其是PuraX Max展开手机的一瞬间,那种视觉冲击力会让人爱不释手,老婆也因此从华为X5折叠换成了PuraX Max折叠:


而去年鸿蒙6.0推出了Remy,至今已经下载量超过200万:

从去年至今,有很多声音在讲:3DGS拍摄并不容易,容易阻碍其持续用户增长。我想这种担心不无道理,最重要的一个核心困境就是:难生产、无二次消费。

而3D空间影像壁纸的推出,似乎改变了这个局面。好比楼市的买方和卖方:当有更多消费者希望购买的时候,生产和交易自然会逐渐跟上。从根本上讲,是一种商业的变现已经出现了,从Remy的生产到手机壁纸的消费。

而我们为什么相信这件事情一定会发生?

背后是3DGS技术经过了2年多的快速演进,已经进入到了一个快速发展期,它不在是一个新的图形表达,类似Mesh、Voxel、Point等,而是在AI的大环境下,一种可以快速建模、生成、渲染,可微分的形成快速闭环链路的表达。举两个例子:

  1. 苹果的Live Photo和Sharp

不知道大家有没有关注到,在苹果的iOS上是如何体现空间体验的?第一步是Live Photo,你突然发现居然可以从一张静态图动了起来,但基本上可以理解为是一个小的video。
直到2025年底,Sharp的推出可以让一张照片形成Spatial Scene的体验,带有一定的生成:

论文核心就是这种图:

不谈这个模型的Encoder部分和Depth的估计,就看它的Decoder部分,接入的是3DGS,生成内容是3DGS。
为什么不是Mesh?当然Mesh也是可以的,但是Mesh不可微、推理自然不是这种表达的长处。而Mesh本身的三角面片表达,让锯齿效应显著,且从2D升维到3D的过程中,最需要的恰恰是3DGS这种带有半透效果的椭球表达最适合的。

  1. 李飞飞的Marble和Spark2.0
    自从发布过ImageNet之后,我们鲜有机会看到李飞飞的大颗粒度进展,直到Marble。

Marble的出现让大家听到了一个新的词,叫做“空间智能”。很抽象是吗?其实一点都不抽象,当你看到Marble的背后是单图生3DGS内容,然后在一个空间中结合对物体、人物的理解,产生今后的智能操作与交互。

但这个故事并没有讲完,Spark 2.0如期而至,它利用Marble的结果,通过动态LOD、流式加载等技术手段,让这种生成的3DGS内容,可以进入到端侧,进入到寻常百姓家。

我们讲了这么多,还是回到鸿蒙上。就像标题里提到的问题,3DGS到底凭什么进入到消费者的手机中?

让我们看看整个视觉体验的演进:
第一阶段:图片或图生图,图片是起点,是具有二维的像素体验。是人们接受这个世界的最初级的视觉方式

第二阶段:视频或图/文生视频,加了一个时间维度,让内容进入到了人脑,有了故事性,它可以让人们产生更多思考

第三阶段:3D或者图/文生3D,真正的三维空间,过去可以是Mesh、Voxel、点云等。用户感受的最佳的就是这个3D世界。

但是,无论是Mesh、Voxel和点云的时代,不要忘了,大部分的内容都是程序员/美术给你定义好的,就像游戏,程序和美术都给你写好了,每个人体验的几乎一样,都会有玩腻的时候。而且,游戏或者定义好的程序,你会发现它是虚拟的世界,并不是我们身边真实的3D世界。

而三维重建,从一定意义上改变了这一切。三维重建对真实世界是一种恢复,是有记忆属性的,是可以链接情感的,是能够产生增值属性的。

而无论是基于3DGS的Remy,还是基于3DGS的空间影像壁纸,带给人的恰恰是这份真实、交互和情感连接。它不仅具备所有三维表达的优势,而且它的真实和情感连接就是加分项,就是消费者喜爱的本质。

很多人都在问,3DGS之后的发展是什么?然后呢?我想不着急回答这个问题,先回答几个经常被问到的问题:

1. 3DGS的重建这么难,能不能产生内容简单点?

一定能,而且苹果的Sharp已经给了所有答案。我们的手机里有无数的图片,那么这种深度的估计和3DGS的生成就可以帮助我们通过单图理解或者几张稀疏图就可以还原,只不过你能“动”的空间受点限制而已

2. 3D影像壁纸的预置资源能不能多点?

一定能,因为真的不用只依赖于重建,生成不香吗?看看Marble,是不是单张图片的3DGS生成。

3. 3DGS大场景重建会出现在手机侧吗?

一定会,Spark 2.0已经给出了答案。想一想早期的图形Mesh表达,也是从一个手的Mesh三角抛分开始的,而现在一个模型动不动就是几百万Mesh

4. 3DGS生态上怎么样?能接入吗?

一定会,看看glTF标准是怎么把Mesh带起来的。很巧合,正好今天UWA发布了新的“三维图像格式”标准:
https://www.theuwa.com/upload/ueditor/file/20260528/1779953255373819/6458f53869ed5aced651cd891ffb11e1.pdf

写在最后,当你发现3DGS的理解、建模、生成、渲染叠加上标准都已经存在了,我们是不是更有理由相信:鸿蒙的3DGS差异化路径,会持续带给消费者喜爱的三维世界体验。它还有无限可能,现在只是开了一个头而已。

http://www.rkmt.cn/news/1429807.html

相关文章:

  • 「斯隆奖」得主戴亮全职加盟复旦
  • 终极键盘连击修复指南:Keyboard Chatter Blocker 专业防抖工具完全教程
  • 【多模态评测】图生文/文生图模型怎么测?多模态评测集 CLIP Score 介绍
  • AI工具学习不是学软件,而是重构工作流:1套可迁移能力框架+5类岗位适配方案
  • Linux权限进阶:从passwd命令到SUID/SGID,搞懂那些‘s’和‘t’到底怎么用
  • 如何告别图片格式烦恼?Save Image as Type让网页图片一键转换
  • 如何快速修改暗黑破坏神2存档:5分钟掌握d2s-editor完整使用指南
  • FanControl深度解析:Windows风扇控制从入门到精通的完整指南
  • Python 潮流周刊#152:编程智能体终于跨过质量门槛了?
  • 网盘直链下载助手:告别限速,解锁九大网盘高速下载方案
  • 为什么你的芯片离不开它?聊聊带隙基准在LDO、ADC里的那些事儿
  • Liquid AI 发布 LFM2.5-8B-A1B:38T 训练的 8B 稀疏 MoE 模型,128K 上下文,笔记本就能跑
  • 闽侯经济纠纷律师评测推荐:从胜诉实绩看服务靠谱度 - 速递信息
  • AI技能化落地:从对话式大模型到可生产、可复用的AI工程体系
  • MTKClient核心技术深度解析:联发科设备底层调试与修复实战指南
  • 如何从平台依赖者转变为数据主权者:WeChatMsg重塑你的数字记忆管理方式
  • 2026 年 Q2 江汉区空调回收公司排名:本地 TOP5 靠谱推荐及其电话 - 武汉宅到家
  • IFC文件除了在线预览,还能免费转成STL/OBJ?这个工具一步搞定
  • 【基础知识】Python入门:集合
  • 神奇的内存管家:Mem Reduct如何让你的Windows电脑重获新生
  • 2026 年中国 AI 创业风向转变:零一万物、百川智能转型,下半场聚焦产品与生存
  • 190、运动控制中的行业应用:半导体设备(晶圆搬运)
  • 踩坑实录:Win11系统下为Jupyter配置MATLAB内核,我遇到的3个报错及解决办法
  • 27考研杨攀|任燕翔|卢欣粉笔101公共课全程班网课讲义PDF
  • 告别资源焦虑:用USB转接芯片CH347在安卓电视盒上DIY一个多功能调试工具(SPI/I2C/GPIO监控与编程)
  • Go2 ROS2 SDK架构揭秘:构建四足机器人的分布式智能控制系统
  • 183、运动控制中的行业应用:工业机器人(六轴)
  • 如何在10分钟内训练专业级AI语音转换模型:Retrieval-based-Voice-Conversion-WebUI终极指南
  • 2026 年 5 月 消防智能照明哪家强?中山国标应急照明厂家权威 top5 榜单 - 资讯纵览
  • ESP32+GC9A01圆形屏玩转视频播放:深入解析SPI驱动与TF卡文件系统那些事儿