世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

12个月冲击物理AGI的“GPT-3时刻”

世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代” – 量子位

首页

资讯

智能车

智库

活动

MEET大会

AIGC

扫码关注量子位

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

思邈

2026-05-28

21:01:16

来源:

量子位

12个月冲击物理AGI的“GPT-3时刻”

允中 发自 凹非寺

量子位 | 公众号 QbitAI

后空翻、跑酷、单手抓举几十公斤……

过去两年,人形机器人最出圈的高光时刻,几乎都发生在精心布光的舞台上。

但镜头之外,有一个更朴素的问题始终悬而未决:它到底什么时候能走进你家,稳稳端起一杯水、收好一桌碗筷、把脏衣篮抱进洗手间?

5月20日,

极佳视界

没有再用“五年内”这类含糊措辞来搪塞。它把通用人形机器人真机,直接推进了武汉光谷一处真实的居民社区:

那里有人住、有孩子把玩具撒一地、家具随时会被挪动位置。

在发布会现场,极佳视界还首次完整披露了过去三年沉淀下来的

“双金字塔”

技术体系。

一边是

数据金字塔

,从互联网视频、真人数据、世界模型模拟器、仿真合成数据一路走到真机数据;

另一边是

算法金字塔

,围绕世界模拟、动作对齐、经验强化搭建具身基础模型的自我进化路径。

资本市场也已经提前投票。2026年3月至4月,极佳视界在短短一个月内连续完成两轮融资,合计金额约

25亿元

,并跻身国内首个世界模型

“百亿独角兽”

于是,一个更值得追踪的问题浮出水面:

当100台机器人开始进入真实家庭,当双金字塔体系开始吃到长周期、多变量、带有人类反馈的真机数据,当25亿元融资把研发、量产与场景落地同时推上快车道,物理AGI会不会真的迎来自己的临界点?

务实的轮臂机器人与百台真机进家

极佳视界联合创始人、首席科学家

朱政

博士,这一次走向台前,身上多了一个新标签:

拾光品牌CEO

作为全场焦点的具身智能C端子品牌,朱政在发布会上留下了一段近乎产品宣言的定调:

AGI不该只停留在屏幕里。我们不是在讲一个遥远的未来故事,而是在把骨子里对物理AGI的信仰,变成真实的产品。

在这款第一代产品——

拾光S1

的设计哲学里,能清晰看到这家公司对

“真实家庭场景”

极其具体的解构。

最具视觉冲击力的“全人形+双足”路线,并没有出现在拾光S1身上。相反,它采用了一种更务实的

家庭版轮臂构型

——下半身轮式底盘,上半身人形双臂。

这是一组带有鲜明产品观的取舍。

毕竟在现阶段,家庭场景对机器人的真实刚需,是稳当地端水、收拾餐具、抱起脏衣篮、把零食递到孩子手上,而不是在客厅里完成酷炫的跑酷动作。

相比之下,轮臂构型在

稳定性、安全性、续航以及硬性成本

上,显然都更占优势。

面对中国家庭的

真实地板宽度、真实门洞尺寸以及真实的预算曲线

,拾光S1展现出了一种极为清醒且务实的市场姿态。

而在务实的硬件外壳之下,支撑其运转的是极佳视界自研的

具身基础模型(GigaBrain系列)

该模型实现了从感知、理解到行动的完整闭环,能够自主识别物体与场景、规划路径,并执行包含抓取、对齐、折叠、归类等多步骤的

长程任务

回到硬核的商业化进展上,极佳视界现场宣布:拾光S1已斩获真实家庭场景的

百台量产订单

,将率先部署于武汉光谷之寓——一处位于光谷的真实居民住宅社区。

具体的落地节奏也已经排定好:

5月31日起

:拾光S1真实家庭场景展示体验空间面向公众开放;

第三季度起:正式开启百台规模化运营;

届时:下一代产品拾光S2将同步发布,并开启真实家庭创始版预定通道。

把“100台”这个数字放进全球具身智能的坐标系来看,其含金量并不在于数字本身,而在于

“家庭”

二字。

纵观全球,Figure AI挺进了宝马工厂,但其家庭场景仍处于试点阶段;1X虽开放过NEO的预订,但实际履约规模仍停留在数十台;Tesla Optimus至今则尚未真正对外部消费者开售。

在主流国内具身智能玩家里,目前能够拿出一份可履约家庭订单的团队,也屈指可数。

究其原因,

进工厂和进家庭,完全是两个数量级的难度。

工业工厂是高度结构化的,光线、节拍、物料位置基本恒定。

而家庭场景则是极度的“非结构化”:今天家具被挪动了位置,明天孩子把玩具撒了一地,后天又有客人突然到访……所有的动态变量都在无限叠加。

这也揭示了当前行业最隐秘的痛点——当下具身智能最稀缺的资源,不是算法,也不是单纯的算力,而是

在真实家庭里、长周期、多变量、带有人类反馈(RLHF)的真机数据

这种数据,在实验室里造不出来,在自动化工厂里也补不出来。

一旦第三季度这百台机器人真正跑起来,产生的将是难以被复制的

核心数据资产:

家庭场景下的真实故障率、用户偏好分布、更具烟火气的长尾任务清单,以及人机交互的真实边界。

这些数据,将成为GigaBrain后续模型迭代不可替代的燃料。

值得注意的是,在C端家庭场景高调破局的同时,极佳视界的B端工业节奏也在平行推进。

就在发布会前不久,极佳视界联合

一汽模具、阿里云

,完成了

国内首个具身智能机器人在真实工业制造场景的全流程落地

在这场跨界合作中,团队成功将传统自动化方案长达数月的场景适配周期,压缩到了

短短几周

家用求广,工业求深。

左手C端场景的数据飞轮,右手B端工业的标杆落地,极佳视界的双线并行矩阵,至此已初具雏形。

技术方法论:解构物理AGI的“双金字塔”体系

如果说“百台部署”回答了具身智能产品何时落地的破局点,那么“双金字塔”回答的就是另一个更底层、更核心的终极命题:

物理AGI的Scaling Law,究竟该建在什么样的基石之上?

在发布会现场,极佳视界合伙人、研发副总裁

叶云

首次完整披露了公司过去三年沉淀的技术方法论。

△极佳视界合伙人、研发副总裁叶云

他直言不讳地指出了当前具身智能行业系统性存在、却鲜少被彻底攻克的两大瓶颈:

一是

数据侧的“既要又要还要”难题。

真机数据精度高但成本高、规模小;仿真数据可扩展但存在不可忽视的sim-to-real gap(虚实迁移鸿沟);互联网视频规模极大,却缺乏动作监督。

任何单一数据源,都无法同时满足规模、密度和真实性。

二是

算法侧的“小马拉大车”困局。

主流VLA(Vision-Language-Action)范式习惯性将视觉、动作token化后塞进大语言模型,但这套机制天然不擅长处理3D空间信息、物理因果逻辑以及连续动作编码。

针对这两大痛点,极佳视界给出的解法是:

将数据与算法分别解构,用结构化的“双金字塔”体系强行破局。

数据金字塔的核心,在于解决模型“喂什么”的问题。

极佳视界将其从底到顶划分为5个层级:

互联网视频数据→真人数据→世界模型模拟器→仿真合成数据→真机数据。

在这套架构中,底层管广度,顶层管精度。

而中间三层,正是工程化空间最大、也是过去整个行业最被低估的“腰部力量”。

分层概念在学术界讨论已两年有余,真正拉开差距的是

全栈工程化的落地能力

极佳视界直接为每一层都掏出了对应的商业化或自研硬核产品:

互联网视频层

:YouTube、Panda-70M等公开海量数据的高效复用;

真人数据层:低成本手持数采硬件“U-01”+低成本Ego(第一人称视角)数采硬件“E-01”;

仿真合成与世界模型层:自研具身世界模型平台“GigaWorld-0”;

真机数据层:家庭版轮臂机器人“拾光S1”+低成本真机数采硬件“Maker M01”。

从数据采集、数据生成到模型训练,全链路100%控在极佳视界自己手里。

放眼国内具身智能赛道,能对五层数据做如此系统性、全栈式硬核布局的玩家,目前或许只有极佳视界一家。

一个刚发生的硬核例证是:极佳视界与清华大学合作的研究成果

R2RGen

,正式被机器人顶级会议

RSS 2026

录用。

该技术支持机器人在“仅看一条人类演示”的前提下,就能完成一组任务的空间泛化,其

1条演示的训练效果可直接媲美25条真人演示

这正是数据金字塔中,用算法工具实现“真机数据高倍率放大”的典型降维打击。

如果说数据金字塔是筑基,那么算法金字塔解决的就是“怎么学”的自驱路径。

它由底到顶分为三层:

世界模拟→动作对齐→经验强化

在这条路径上,极佳视界交出了一份极其罕见的成绩单:

在全球三大最权威的具身智能评测中,同时斩获第一

1、世界模拟层(GigaWorld-1)

在世界模型权威评测WorldArena上一举击败

谷歌、英伟达

等国际巨头,登顶全球第一。

它也是全榜单中

首个

综合得分突破60分大关的具身世界模型。

2、动作对齐层(GigaBrain-0系列/GigaWorld-Policy)

极佳视界在该层打出了两张王牌。

前者在全球规模最大的真机评测RoboChallenge中

力压π0.5

等顶流模型斩获第一;

后者则在面向家庭场景的RoboCasa365中,击败了NVIDIA GR00T N1.5,成为榜单上

首个登顶

的世界动作模型(World Action Model)。

3、经验强化层(GigaBrain-0.5M*)

通过“世界模型+强化学习”的双向加持,真正跑通了具身基座模型的自我进化(Self-evolution)。

世界生成、真机操作、家庭场景泛化

这三种本质不同的能力范式,由同一支团队在同一时间节点集中突破,这在行业内极具震撼力。

至此,极佳视界的“双金字塔”完成了它最具里程碑意义的闭环:

它将物理AGI的Scaling Law路径,从纸面上的宏大概念,变成了一套

可对照、可复现、可被量化评测的系统化落地方案

物理AGI的“GPT-3时刻”何时到来?

在发布会现场,极佳视界还扔出了下一代硬件的重磅预告——

拾光S2

将于2026年第三季度正式发布。

这一次,极佳视界没有单纯卷参数,而是将准心扣在了“真实家庭可用性”这三个字上。

拾光S2三大核心指标的升级路径,清晰可见:

空间瘦身

:底盘体积直降60%,极限贴合中国家庭略显狭窄的过道与玄关;

续航跃升:电池续航暴增70%,并全面支持热换电以确保全天候待命;

纵向延展:操作范围扩大40%,最高可执行2.2米高度的纵向家务任务。

对于这次升级,极佳视界联合创始人朱政在现场给出了这样的定义:

S2的核心,不是某个参数变得更漂亮,而是整机开始真正接近真实家庭所需要的“可用性”。

据悉,真实家庭创始版预定通道,也将在发布时同步开启。

相比于硬件的渐进式改良,更具行业风向标意义的,是极佳视界首次公开的

基础模型12个月路线图

这张“明牌”的时间表,直接将具身智能的智能化进程进行了量化:

GigaBrain-1:2026年Q3发布,据称是全球首个基于“双金字塔”体系打造的物理AGI基础模型;

GigaBrain-2:进一步拉满Scaling Law的加速器;

GigaBrain-3:基于1000万小时视频数据+100万小时世界-动作数据训练,直接剑指物理AGI的

“GPT-3时刻”

在大模型发展史上,GPT-3的里程碑意义并不在于模型结构本身,而在于它是Scaling Law首次显现“涌现能力”的临界点。

当数据规模与算力跨过那个神秘的阈值,物理世界的认知就会从量变产生质变。

物理AGI的“GPT-3时刻”在理论上同构——

数据规模

(1000万+100万小时)与

算法范式

(双金字塔)在临界点交汇,物理智能体将展现出真正意义上的

通用性

这不是指在实验室预设的场景下机械地干十种家务,而是意味着它能够“空降”到任何一户真实家庭,能应对所有突发的意外,并在每一次环境反馈中完成自我进化。

过去两年,行业对于“物理AGI何时到来”的追问,大多得到了“五年内”、“指日可待”等模糊的回应。

极佳视界这次直接掀掉底牌,把宏大命题拆解为两个确定性的交卷时间:

需要什么样的体系(双金字塔),以及什么时候到达临界点(12个月)

这是一个可以被全行业公开检验的答案。

物理AI“梦之队”集结

除了技术,极佳视界更亮眼的莫过于其核心团队:

创始人兼CEO黄冠

,清华大学自动化系创新领军工程博士。

曾担任地平线机器人视觉感知技术负责人、鉴智机器人合伙人&算法副总裁,并拥有微软亚洲研究院、三星中国研究院等顶尖研究机构工作经历。

他完整经历了过去十年物理AI的技术和产业发展历程,多次带领团队获得全球权威AI比赛世界冠军,并发布多个全球知名AI成果。

联合创始人兼首席科学家朱政

,智源青年学者,发表顶级论文70余篇,引用近2万次。

多篇著作影响力巨大,连续4年入选全球前2%顶尖科学家榜单,多次获得吴文俊自然科学一等奖、最佳学生论文奖、CCF杰出论文奖等荣誉,也是多个顶会领域主席、多项竞赛冠军。

联合创始人孙韶言

,曾担任阿里云总监,地平线数据闭环产品线总经理,在物理世界超大规模数据闭环产品和架构方面拥有行业领先的经验。

他主导了业内首个智能驾驶数据闭环系统的落地,有效提升了数据的处理效率,为智能驾驶技术的发展提供了重要的基础设施支持。

合伙人兼工程副总裁毛继明

,拥有超过16年的仿真/工程/数据/分布式架构方向的经验。

曾担任百度Apollo仿真和工程负责人,以及曾担任百度、赢彻等T10级别架构师,主导多个自动驾驶与世界模型核心项目的技术开发与落地。在高质量数据生成、端到端自动驾驶架构设计以及分布式系统优化领域有着深厚的积累。

可以说,这支团队完整经历了CV、自动驾驶、具身基模、世界模型等物理AI过去十年的发展历程,并在每个阶段都做出了行业领先的世界级成果。

当他们聚集在一起,就共同造就了这支始终引领具身世界模型技术演进的“梦之队”。

资本侧给出的反馈同样明确。

在2026年3月至4月,

短短一个月内

,极佳视界

连续完成两轮融资

,合计金额高达约

25亿元

,一举跻身国内首个世界模型“百亿独角兽”。

据说,其背后的投资方矩阵,覆盖国内最具代表性的顶尖产业资本(华为哈勃就是其中之一)、头部财务机构与重磅国资平台。

三个悬而未决的问题

事实上,极佳视界给出了一套将

算法+数据+本体+场景+商业+时间表

全栈打通的物理AGI闭环路径。

往前看,三项全球权威评测冠军证明了算法架构的优越性;

往下看,“百台进社区”印证了工程化的可靠执行力;

往未来看,三代基础模型路线图则给出了明确的航向。

站在当前节点,未来12个月内,至少有三件事值得整个科技界持续追踪:

第一,

百台家庭部署能否真正跑出有效数据闭环。

家庭环境下机器人能持续工作多久、故障率与人工介入频次、用户偏好如何回流到模型,这是物理智能领域目前最稀缺的资产积累。

第二,

2026年Q3的GigaBrain-1是否能如期发布

,并在能力上对得起“双金字塔”体系所许诺的范式优势。

第三,

GigaBrain-3是否能在12个月后真正触达“GPT-3时刻”

——

或许这是物理AGI赛道目前最具争议、也最具兑现价值的判断。

正如朱政在发布会尾声留下的那句话:

物理AGI服务每一个人的时代,会在一户一户真实家庭中逐渐发生。

大幕已经拉开,这个预言会不会变成现实,我们只需要再等12个月。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

世界模型

机器人

极佳视界

物理AGI

思邈

触觉具身来了个梦之队:天使轮近亿

2026-05-27

图灵奖得主领衔,中国大模型第一梯队集结!2026智源大会,看懂AI下一程

2026-05-25

华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资

2026-05-25

未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026

2026-05-25

扫码分享至朋友圈

相关阅读

机器人会模仿人类微笑了,但我总觉得这笑容……

“人造肌肉”还不够灵活呀

丰色

2021-06-02

创新

机器人

深度学习

加州理工让无人机长出腿:走路飞行无缝切换,还能玩滑板、走钢丝|Sicence子刊

登上Science子刊

梦晨

2021-10-09

j加州理工

机器人

不到400元,将你的手机变成可编程AI机器人丨英特尔出品

安卓玩家的福音

萧箫

2020-09-02

机器人

英特尔

世界模型+强化学习:轻舟智航于骞在德国定义通向通用物理AI的必由之路

世界模型+强化学习

量子位

2026-03-19

世界模型

自动驾驶

这款“咖啡机器人”落地超百家,开启猎户星空机械臂生态第一步

这咖啡竟然如此受欢迎!

量子位

2021-04-15

机器人

猎户星空

缠成一坨的耳机线,这机器人两下就能解开

可整理长达3米的线

鱼羊

2022-08-14

数据线

机器人

热门文章

刚刚,国产AI自己造了AI,全球首例!

2026-05-26

融资700亿!DeepSeek Code真要来了,ACM金牌大神崔添翼挂帅

2026-05-22

李飞飞再出手,空间智能的ImageNet来了

2026-05-22

卡帕西Anthropic最新头衔:技术员工(MTS)

2026-05-26

80集短剧,3天拍完:当电影人下场做Agent,影视生产迎来了“最懂行”的解法

2026-05-22

关于量子位

加入我们

寻求报道

商务合作

扫码关注量子位

追踪人工智能新趋势,报道科技行业新突破

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司

京ICP备17005886号-1


本文来源:量子位