行业动态

世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代”

12个月冲击物理AGI的“GPT-3时刻”

AI_light

29 May 2026 • 20 min read

世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代” – 量子位

首页

资讯

智能车

智库

活动

MEET大会

AIGC

扫码关注量子位

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代”

思邈

2026-05-28

21:01:16

来源：

量子位

12个月冲击物理AGI的“GPT-3时刻”

允中发自凹非寺

量子位 | 公众号 QbitAI

后空翻、跑酷、单手抓举几十公斤……

过去两年，人形机器人最出圈的高光时刻，几乎都发生在精心布光的舞台上。

但镜头之外，有一个更朴素的问题始终悬而未决：它到底什么时候能走进你家，稳稳端起一杯水、收好一桌碗筷、把脏衣篮抱进洗手间？

5月20日，

极佳视界

没有再用“五年内”这类含糊措辞来搪塞。它把通用人形机器人真机，直接推进了武汉光谷一处真实的居民社区：

那里有人住、有孩子把玩具撒一地、家具随时会被挪动位置。

在发布会现场，极佳视界还首次完整披露了过去三年沉淀下来的

“双金字塔”

技术体系。

一边是

数据金字塔

，从互联网视频、真人数据、世界模型模拟器、仿真合成数据一路走到真机数据；

另一边是

算法金字塔

，围绕世界模拟、动作对齐、经验强化搭建具身基础模型的自我进化路径。

资本市场也已经提前投票。2026年3月至4月，极佳视界在短短一个月内连续完成两轮融资，合计金额约

25亿元

，并跻身国内首个世界模型

“百亿独角兽”

。

于是，一个更值得追踪的问题浮出水面：

当100台机器人开始进入真实家庭，当双金字塔体系开始吃到长周期、多变量、带有人类反馈的真机数据，当25亿元融资把研发、量产与场景落地同时推上快车道，物理AGI会不会真的迎来自己的临界点？

务实的轮臂机器人与百台真机进家

极佳视界联合创始人、首席科学家

朱政

博士，这一次走向台前，身上多了一个新标签：

拾光品牌CEO

。

作为全场焦点的具身智能C端子品牌，朱政在发布会上留下了一段近乎产品宣言的定调：

AGI不该只停留在屏幕里。我们不是在讲一个遥远的未来故事，而是在把骨子里对物理AGI的信仰，变成真实的产品。

在这款第一代产品——

拾光S1

的设计哲学里，能清晰看到这家公司对

“真实家庭场景”

极其具体的解构。

最具视觉冲击力的“全人形+双足”路线，并没有出现在拾光S1身上。相反，它采用了一种更务实的

家庭版轮臂构型

——下半身轮式底盘，上半身人形双臂。

这是一组带有鲜明产品观的取舍。

毕竟在现阶段，家庭场景对机器人的真实刚需，是稳当地端水、收拾餐具、抱起脏衣篮、把零食递到孩子手上，而不是在客厅里完成酷炫的跑酷动作。

相比之下，轮臂构型在

稳定性、安全性、续航以及硬性成本

上，显然都更占优势。

面对中国家庭的

真实地板宽度、真实门洞尺寸以及真实的预算曲线

，拾光S1展现出了一种极为清醒且务实的市场姿态。

而在务实的硬件外壳之下，支撑其运转的是极佳视界自研的

具身基础模型（GigaBrain系列）

。

该模型实现了从感知、理解到行动的完整闭环，能够自主识别物体与场景、规划路径，并执行包含抓取、对齐、折叠、归类等多步骤的

长程任务

。

回到硬核的商业化进展上，极佳视界现场宣布：拾光S1已斩获真实家庭场景的

百台量产订单

，将率先部署于武汉光谷之寓——一处位于光谷的真实居民住宅社区。

具体的落地节奏也已经排定好：

5月31日起

：拾光S1真实家庭场景展示体验空间面向公众开放；

第三季度起：正式开启百台规模化运营；

届时：下一代产品拾光S2将同步发布，并开启真实家庭创始版预定通道。

把“100台”这个数字放进全球具身智能的坐标系来看，其含金量并不在于数字本身，而在于

“家庭”

二字。

纵观全球，Figure AI挺进了宝马工厂，但其家庭场景仍处于试点阶段；1X虽开放过NEO的预订，但实际履约规模仍停留在数十台；Tesla Optimus至今则尚未真正对外部消费者开售。

在主流国内具身智能玩家里，目前能够拿出一份可履约家庭订单的团队，也屈指可数。

究其原因，

进工厂和进家庭，完全是两个数量级的难度。

工业工厂是高度结构化的，光线、节拍、物料位置基本恒定。

而家庭场景则是极度的“非结构化”：今天家具被挪动了位置，明天孩子把玩具撒了一地，后天又有客人突然到访……所有的动态变量都在无限叠加。

这也揭示了当前行业最隐秘的痛点——当下具身智能最稀缺的资源，不是算法，也不是单纯的算力，而是

在真实家庭里、长周期、多变量、带有人类反馈（RLHF）的真机数据

。

这种数据，在实验室里造不出来，在自动化工厂里也补不出来。

一旦第三季度这百台机器人真正跑起来，产生的将是难以被复制的

核心数据资产：

家庭场景下的真实故障率、用户偏好分布、更具烟火气的长尾任务清单，以及人机交互的真实边界。

这些数据，将成为GigaBrain后续模型迭代不可替代的燃料。

值得注意的是，在C端家庭场景高调破局的同时，极佳视界的B端工业节奏也在平行推进。

就在发布会前不久，极佳视界联合

一汽模具、阿里云

，完成了

国内首个具身智能机器人在真实工业制造场景的全流程落地

。

在这场跨界合作中，团队成功将传统自动化方案长达数月的场景适配周期，压缩到了

短短几周

。

家用求广，工业求深。

左手C端场景的数据飞轮，右手B端工业的标杆落地，极佳视界的双线并行矩阵，至此已初具雏形。

技术方法论：解构物理AGI的“双金字塔”体系

如果说“百台部署”回答了具身智能产品何时落地的破局点，那么“双金字塔”回答的就是另一个更底层、更核心的终极命题：

物理AGI的Scaling Law，究竟该建在什么样的基石之上？

在发布会现场，极佳视界合伙人、研发副总裁

叶云

首次完整披露了公司过去三年沉淀的技术方法论。

△极佳视界合伙人、研发副总裁叶云

他直言不讳地指出了当前具身智能行业系统性存在、却鲜少被彻底攻克的两大瓶颈：

一是

数据侧的“既要又要还要”难题。

真机数据精度高但成本高、规模小；仿真数据可扩展但存在不可忽视的sim-to-real gap（虚实迁移鸿沟）；互联网视频规模极大，却缺乏动作监督。

任何单一数据源，都无法同时满足规模、密度和真实性。

二是

算法侧的“小马拉大车”困局。

主流VLA（Vision-Language-Action）范式习惯性将视觉、动作token化后塞进大语言模型，但这套机制天然不擅长处理3D空间信息、物理因果逻辑以及连续动作编码。

针对这两大痛点，极佳视界给出的解法是：

将数据与算法分别解构，用结构化的“双金字塔”体系强行破局。

数据金字塔的核心，在于解决模型“喂什么”的问题。

极佳视界将其从底到顶划分为5个层级：

互联网视频数据→真人数据→世界模型模拟器→仿真合成数据→真机数据。

在这套架构中，底层管广度，顶层管精度。

而中间三层，正是工程化空间最大、也是过去整个行业最被低估的“腰部力量”。

分层概念在学术界讨论已两年有余，真正拉开差距的是

全栈工程化的落地能力

。

极佳视界直接为每一层都掏出了对应的商业化或自研硬核产品：

互联网视频层

：YouTube、Panda-70M等公开海量数据的高效复用；

真人数据层：低成本手持数采硬件“U-01”+低成本Ego（第一人称视角）数采硬件“E-01”；

仿真合成与世界模型层：自研具身世界模型平台“GigaWorld-0”；

真机数据层：家庭版轮臂机器人“拾光S1”+低成本真机数采硬件“Maker M01”。

从数据采集、数据生成到模型训练，全链路100%控在极佳视界自己手里。

放眼国内具身智能赛道，能对五层数据做如此系统性、全栈式硬核布局的玩家，目前或许只有极佳视界一家。

一个刚发生的硬核例证是：极佳视界与清华大学合作的研究成果

R2RGen

，正式被机器人顶级会议

RSS 2026

录用。

该技术支持机器人在“仅看一条人类演示”的前提下，就能完成一组任务的空间泛化，其

1条演示的训练效果可直接媲美25条真人演示

。

这正是数据金字塔中，用算法工具实现“真机数据高倍率放大”的典型降维打击。

如果说数据金字塔是筑基，那么算法金字塔解决的就是“怎么学”的自驱路径。

它由底到顶分为三层：

世界模拟→动作对齐→经验强化

。

在这条路径上，极佳视界交出了一份极其罕见的成绩单：

在全球三大最权威的具身智能评测中，同时斩获第一

。

1、世界模拟层（GigaWorld-1）

在世界模型权威评测WorldArena上一举击败

谷歌、英伟达

等国际巨头，登顶全球第一。

它也是全榜单中

首个

综合得分突破60分大关的具身世界模型。

2、动作对齐层（GigaBrain-0系列/GigaWorld-Policy）

极佳视界在该层打出了两张王牌。

前者在全球规模最大的真机评测RoboChallenge中

力压π0.5

等顶流模型斩获第一；

后者则在面向家庭场景的RoboCasa365中，击败了NVIDIA GR00T N1.5，成为榜单上

首个登顶

的世界动作模型（World Action Model）。

3、经验强化层（GigaBrain-0.5M*）

通过“世界模型+强化学习”的双向加持，真正跑通了具身基座模型的自我进化（Self-evolution）。

将

世界生成、真机操作、家庭场景泛化

这三种本质不同的能力范式，由同一支团队在同一时间节点集中突破，这在行业内极具震撼力。

至此，极佳视界的“双金字塔”完成了它最具里程碑意义的闭环：

它将物理AGI的Scaling Law路径，从纸面上的宏大概念，变成了一套

可对照、可复现、可被量化评测的系统化落地方案

。

物理AGI的“GPT-3时刻”何时到来？

在发布会现场，极佳视界还扔出了下一代硬件的重磅预告——

拾光S2

将于2026年第三季度正式发布。

这一次，极佳视界没有单纯卷参数，而是将准心扣在了“真实家庭可用性”这三个字上。

拾光S2三大核心指标的升级路径，清晰可见：

空间瘦身

：底盘体积直降60%，极限贴合中国家庭略显狭窄的过道与玄关；

续航跃升：电池续航暴增70%，并全面支持热换电以确保全天候待命；

纵向延展：操作范围扩大40%，最高可执行2.2米高度的纵向家务任务。

对于这次升级，极佳视界联合创始人朱政在现场给出了这样的定义：

S2的核心，不是某个参数变得更漂亮，而是整机开始真正接近真实家庭所需要的“可用性”。

据悉，真实家庭创始版预定通道，也将在发布时同步开启。

相比于硬件的渐进式改良，更具行业风向标意义的，是极佳视界首次公开的

基础模型12个月路线图

。

这张“明牌”的时间表，直接将具身智能的智能化进程进行了量化：

GigaBrain-1：2026年Q3发布，据称是全球首个基于“双金字塔”体系打造的物理AGI基础模型；

GigaBrain-2：进一步拉满Scaling Law的加速器；

GigaBrain-3：基于1000万小时视频数据+100万小时世界-动作数据训练，直接剑指物理AGI的

“GPT-3时刻”

。

在大模型发展史上，GPT-3的里程碑意义并不在于模型结构本身，而在于它是Scaling Law首次显现“涌现能力”的临界点。

当数据规模与算力跨过那个神秘的阈值，物理世界的认知就会从量变产生质变。

物理AGI的“GPT-3时刻”在理论上同构——

当

数据规模

（1000万+100万小时）与

算法范式

（双金字塔）在临界点交汇，物理智能体将展现出真正意义上的

通用性

。

这不是指在实验室预设的场景下机械地干十种家务，而是意味着它能够“空降”到任何一户真实家庭，能应对所有突发的意外，并在每一次环境反馈中完成自我进化。

过去两年，行业对于“物理AGI何时到来”的追问，大多得到了“五年内”、“指日可待”等模糊的回应。

极佳视界这次直接掀掉底牌，把宏大命题拆解为两个确定性的交卷时间：

需要什么样的体系（双金字塔），以及什么时候到达临界点（12个月）

。

这是一个可以被全行业公开检验的答案。

物理AI“梦之队”集结

除了技术，极佳视界更亮眼的莫过于其核心团队：

创始人兼CEO黄冠

，清华大学自动化系创新领军工程博士。

曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人&算法副总裁，并拥有微软亚洲研究院、三星中国研究院等顶尖研究机构工作经历。

他完整经历了过去十年物理AI的技术和产业发展历程，多次带领团队获得全球权威AI比赛世界冠军，并发布多个全球知名AI成果。

联合创始人兼首席科学家朱政

，智源青年学者，发表顶级论文70余篇，引用近2万次。

多篇著作影响力巨大，连续4年入选全球前2%顶尖科学家榜单，多次获得吴文俊自然科学一等奖、最佳学生论文奖、CCF杰出论文奖等荣誉，也是多个顶会领域主席、多项竞赛冠军。

联合创始人孙韶言

，曾担任阿里云总监，地平线数据闭环产品线总经理，在物理世界超大规模数据闭环产品和架构方面拥有行业领先的经验。

他主导了业内首个智能驾驶数据闭环系统的落地，有效提升了数据的处理效率，为智能驾驶技术的发展提供了重要的基础设施支持。

合伙人兼工程副总裁毛继明

，拥有超过16年的仿真/工程/数据/分布式架构方向的经验。

曾担任百度Apollo仿真和工程负责人，以及曾担任百度、赢彻等T10级别架构师，主导多个自动驾驶与世界模型核心项目的技术开发与落地。在高质量数据生成、端到端自动驾驶架构设计以及分布式系统优化领域有着深厚的积累。

可以说，这支团队完整经历了CV、自动驾驶、具身基模、世界模型等物理AI过去十年的发展历程，并在每个阶段都做出了行业领先的世界级成果。

当他们聚集在一起，就共同造就了这支始终引领具身世界模型技术演进的“梦之队”。

资本侧给出的反馈同样明确。

在2026年3月至4月，

短短一个月内

，极佳视界

连续完成两轮融资

，合计金额高达约

25亿元

，一举跻身国内首个世界模型“百亿独角兽”。

据说，其背后的投资方矩阵，覆盖国内最具代表性的顶尖产业资本（华为哈勃就是其中之一）、头部财务机构与重磅国资平台。

三个悬而未决的问题

事实上，极佳视界给出了一套将

算法+数据+本体+场景+商业+时间表

全栈打通的物理AGI闭环路径。

往前看，三项全球权威评测冠军证明了算法架构的优越性；

往下看，“百台进社区”印证了工程化的可靠执行力；

往未来看，三代基础模型路线图则给出了明确的航向。

站在当前节点，未来12个月内，至少有三件事值得整个科技界持续追踪：

第一，

百台家庭部署能否真正跑出有效数据闭环。

家庭环境下机器人能持续工作多久、故障率与人工介入频次、用户偏好如何回流到模型，这是物理智能领域目前最稀缺的资产积累。

第二，

2026年Q3的GigaBrain-1是否能如期发布

，并在能力上对得起“双金字塔”体系所许诺的范式优势。

第三，

GigaBrain-3是否能在12个月后真正触达“GPT-3时刻”

——

或许这是物理AGI赛道目前最具争议、也最具兑现价值的判断。

正如朱政在发布会尾声留下的那句话：

物理AGI服务每一个人的时代，会在一户一户真实家庭中逐渐发生。

大幕已经拉开，这个预言会不会变成现实，我们只需要再等12个月。

世界模型

机器人

极佳视界

物理AGI

思邈

触觉具身来了个梦之队：天使轮近亿

2026-05-27

图灵奖得主领衔，中国大模型第一梯队集结！2026智源大会，看懂AI下一程

2026-05-25

华为具身大脑一号位创业，用认知科学造世界模型，获亿元级融资

2026-05-25

未来推理将吃掉70%算力，30%留给训练丨硅谷投资人张璐@AIGC2026

2026-05-25

扫码分享至朋友圈

世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代”

AI_light

Sign up for more like this.

光帆科技与腾讯出行服务达成战略合作开启新一轮预售

4nm！比亚迪自研AI芯片来了：制程对齐英伟达，算力拉爆特斯拉

半数华人、3位亿万富翁：这张十年前的量化实习生合照，藏着 AI 时代的新贵版图