具身Scaling Law押对了!独角兽新品1小时学会新任务,重复1800次成功率99%
机器人模型卷出新高度
具身Scaling Law押对了!独角兽新品1小时学会新任务,重复1800次成功率99% – 量子位
首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">
具身Scaling Law押对了!独角兽新品1小时学会新任务,重复1800次成功率99%
克雷西
2026-04-06
13:17:06
来源:
量子位
机器人模型卷出新高度
克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
机器人也开始内卷了,一位表现极其离谱的“新员工”,直接拉高了机器人的“就业门槛”。
具身智能独角兽Generalist,刚刚推出了最新的研究成果——新模型Gen-1。
在包装手机和折叠纸箱这些精细活儿上,它把机器人的成功率从64%硬生生拉到了99%,几乎告别了手残职业病。
以前折叠一个标准纸箱需要慢悠悠地磨掉34秒,现在GEN-1仅用12.1秒就能完成,效率直接开启了3倍速模式。
而且,GEN-1的表现,也用实际表现验证了机器人领域的Scaling Law。
机器人模型卷出新高度
GEN-1上岗后的表现简直像是在倍速播放,而且即便面对维护扫地机器人200次这种枯燥任务,它也能稳如泰山。
甚至连续装箱1800次,也能从从容容游刃有余。
更离谱的是它处理突发状况的脑回路。
如果零件在流水线上被意外撞歪了,它绝不会傻站在那儿报错,会自己切换抓取角度,甚至动用两只手配合着把活干完。
这种靠直觉解决问题的即兴智能,让它在处理乱七八糟的杂物时表现得像个干了十年的老师傅,那种死读程序的铁疙瘩僵硬感彻底消失了。
用人类活动记录训练机器人
为了让GEN-1具备使机器人变身“全能打工人”的能力,研发团队对数据处理架构进行了重写。
他们没有死磕昂贵且难以扩展的机器人遥操作数据这条老路,转而通过低成本穿戴设备捕捉了数百万项人类活动记录,让AI像看电影一样预习物理世界的潜规则。
这种“去机器人化”的预训练方案巧妙绕过了数据规模的瓶颈,让基础模型在接触机械臂之前,就已经从人类视角洞察了空间、时间与物理因果。
这种基于50万小时高保真物理交互数据集练就的底座,让它的学习效率直接起飞,达到了前代模型的10倍。
哪怕是面对从未见过的奇怪任务或陌生的机器身体,给GEN-1一个小时的实机演示,也能让它火速入职。
另外,为了让机器人的动作不再卡成PPT,以及实现实时操控,研发团队还在推理端祭出了两项关键技术。
首先是专门为物理世界打造的分页注意力(Paged Attention)机制。
在处理PB级别的物理交互数据流时,传统的内存管理方式容易导致计算资源分配不均,进而产生响应延迟。
Paged Attention通过更高效地调度计算资源,解决了动作指令发射时的调度难题,确保每一个动作指令都能在毫秒级的时间维度内即时发射,让AI的反应速度能跟上现实世界的物理节奏。
配合演进的还有一套Harmonic Reasoning系统。它作为推理层面的核心组件,改变了以往单一路径预测动作的死板模式。
它允许模型在输出指令时通过多尺度的动态调节来引导权重,使其在执行折叠纸箱或包装手机等复杂动态任务时,能够展现出超越单一模型权重分布的性能上限。
研发团队为此投入数月时间优化训练稳定性,并编写了大量自定义内核来压榨硬件算力的极限。
机器人领域的Scaling Law
GEN-1的性能跨越,证明了Scaling Law在物理世界依然有效——只要喂够了数据和算力,机器人的脑子也会产生“开窍”时刻。
通过大规模预训练,机器人不再生硬地模仿动作序列,自己悟出了空间、时间和因果关系的规律,感知到了物体之间的相互影响。
有了直觉之后,机器人干活就开始带点“灵性”。当任务中途出现没见过的阻碍,它会自发尝试一些教学大纲以外的操作,比如发现东西塞不进去时会像人一样晃晃袋子。
这种即兴解题的能力源于它真正理解了“动作会导致后果”的逻辑。
即使现场零件被意外撞歪,它也能凭直觉找回节奏,不需要人类像保姆一样每一步都盯着纠错。
这种在真实世界摔打出来的经验,让原本悬浮在百科全书里的抽象文字变成了实打实的行动力。
研发团队通过对齐技术,给这种即兴天赋装上了“导航仪”,确保机器人“临场发挥”的动作依然会严丝合缝地待在用户设定的规范里。
这种进化,让机器人从一个只能按部就班的机器,变成了一个真正懂物理常识、能独立处理复杂局面的“职场老手”。
DeepMind大牛创业成果
GEN-1的底层逻辑,源于资深团队在机器人领域的长期积累,创始人Pete Florence的技术背景,为这一方案提供了深厚的理论底色。
他曾任Google DeepMind高级研究科学家,通过Dense Object Nets等工作探索了视觉引导下机器人从感知到动作的端到端学习路径。
在谷歌PaLM团队工作期间,他作为核心力量参与并主导了PaLM-E、RT-2等多个具备代际跨越意义的机器人项目。
2024年,Pete Florence离开谷歌并创立了Generalist。
即便在他离职后的2025年3月,DeepMind在发布的Gemini Robotics论文中依然四次引用了他参与合著的研究。
参考链接:
https://generalistai.com/blog/apr-02-2026-GEN-1
版权所有,未经授权不得以任何形式转载及使用,违者必究。
机器人
克雷西
别再让AI只干零活了!AI工具正在接管投放全链路
2026-03-31
整个公司一起吃虾!这个开源项目,让OpenClaw实现企业级部署
2026-03-30
大厂抢郭达雅进行时!DeepSeek核心成员还是个“综艺巨佬”
2026-03-22
小米神操作!认领榜一神秘模型Hunter Alpha,龙虾之父都忍不住打听
2026-03-19
扫码分享至朋友圈
相关阅读
腾讯机器人实验室一号员工创业,人形机器人又添重磅玩家
轮式底盘+人形上半身
梦晨
2023-10-05
创业
机器人
爆发力超越波士顿动力液压机器人,PHYBOT M1实现全球首次全尺寸重型电驱人形机器人完美拟人态后空翻
全尺寸,后空翻机器人
henry
2025-11-26
机器人
最高工资322万!OpenAI开招机器人工程师
OpenAI重启机器人计划传闻实锤
克雷西
2025-01-13
OpenAI
机器人
一群机器狗亮相MIT,集体后空翻、踢足球,网友:赶紧去看黑镜压压惊
鱼羊
乾明
2019-11-09
MIT
机器人
迷你猎豹
百度携手优必选,共探AI大模型+人形机器人创新应用
将拓展具身智能技术的应用场景
量子位
2024-04-01
机器人
波士顿动力再惊艳!机器人大秀男团舞,举手投足人味满满,多次转卖后展示新标签
网友:越发像娱乐公司了
十三
2022-10-18
Atlas
Spot
机器人
波士顿动力
热门文章
ClawTip来了! 京东科技首发推出AI智能体的“专属自主零钱包”
2026-03-31
全球权威大模型盲测榜单公布,阿里千问3.6登顶中国最强编程模型
2026-04-03
刚刚,TRAE SOLO上线独立端:已经不满足写代码,还要跨界干活!
2026-03-31
实测拿215项SOTA的Qwen3.5-Omni:摄像头一开,AI给我现场讲论文、撸代码
2026-03-31
Claude绝望时会勒索人类!一共171种情绪,为了生存不择手段
2026-04-03
关于量子位
加入我们
寻求报道
商务合作
扫码关注量子位
追踪人工智能新趋势,报道科技行业新突破
量子位 QbitAI 版权所有©北京极客伙伴科技有限公司
京ICP备17005886号-1
本文来源:量子位