5亿Tokens白送!全球首个商用AI主机发布,终于能放开烧Token了
这是这个时代的印刷机
5亿Tokens白送!全球首个商用AI主机发布,终于能放开烧Token了 – 量子位
首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">
5亿Tokens白送!全球首个商用AI主机发布,终于能放开烧Token了
Jay
2026-05-29
17:05:30
来源:
量子位
这是这个时代的印刷机
Jay 发自 凹非寺
量子位 | 公众号 QbitAI
Token按量计费的时代,该翻篇了。
2026年,龙虾热、养马潮,
AI真的从对话走向了执行,「超级个体」不再只是说说而已……
OPC
(One Person Company,一人公司)
这个群体,正以肉眼可见的速度批量涌现。
△图为AI生成
但兴奋劲过了之后,一个尴尬的事实浮出水面。
Agent用得越好,自动化运行时间就更长;而运行更长,Token账单,能吓死个人……
都「一人」公司了,总不能买几张
H200
放家里。
我们前阵子刚办完AIGC大会。大家可能不知道,办一场大会,背后的工作流真的相当繁琐。
所以我一直在用
Codex
,尽可能把任务自动化。
效果是真的好。但问题是,真的太烧Token了。连Plus会员的额度,我现在都有点不太够用。
如今,终于有设备厂商,下场解决这个痛点。
这是刚发布的
联想百应AI主机
。
三台专为Agent设计的
AI边缘设备
。
「软硬服」三位一体,开箱即用。
OPC与成长型企业,都撞上了一堵墙
AI带来了新的生产力革新,但
大模型按Token计费
。这个定价模式听着没啥毛病,和水电费一样。但当你真的把核心业务全面接入Agent后,你会发现
一个残酷现实
:
月支出一直是在线性增长的,根本没看到经济学课本上讲的规模效应。
AI原生越好、自动化比例越高,Token消耗会越来越夸张,短期收益根本无法覆盖。这就导致一个悖论:
明知道很多事情还有Agent参与的空间,但自动化程度升级后,反而不敢放开用。
没办法,看着一路飙升的Token账单,心理素质再强也会畏手畏脚。
安全则是更大的问题。
Agent要深入业务,就必然要接触核心数据。
内容行业相对来说还好,但像跨境电商的
选品
策略、AI短剧团队的
原创资产
、制造企业的
工艺参数和设计图纸
……
这些东西是命根子。
在OPC的语境下,这个问题被进一步放大。企业的核心资产高度集中在创始人一个人身上,一次泄露,可能就是灭顶之灾。
有人说,
那我自己本地部署不就行了?
上面这两个问题都能解决。
理论上可以。但实际操作起来,选模型、搭环境、调参数、做场景适配……
每一步都是门槛
。
要知道,在现在的AI创业竞争环境下,慢一步是真的会要命的。
大多数OPC没有专职AI工程师,光靠创始人自己折腾,
要么产品idea被别人抢先,要么底层假设直接被下一代模型吃掉了
。
△图为AI生成
这也是为什么我觉得,
一个封装好,开箱即用的解决方案,在这个时代确实值得付费。
之前,云端方案保证了「智能」,但无法解决Token价格昂贵和安全问题;本地方案便宜,但一般太重太复杂。
如果把这两者的优点结合在一起,岂不是一个完美的中间态?
而AI主机,恰恰是最好的载体。它在「云端-本地」间取得平衡点,从而以尽可能低的边际成本获取智能。
联想,这次正是「冲」着这个市场生态位来的。
AI主机的独特价值
真就是「冲」着过来的。
前天下班后看的联想百应AI主机新产品发布会,谁想到他们一口气出了
三款AI主机
,快给我上下文干爆了。
不过,捋了下后发现其实底层逻辑都差不多,只是产品定位和客户画像不太一样。
本质上,
三款AI主机都是智能中枢——
用户通过电脑、手机或平板发出请求,接下来AI主机会根据任务难度,自行判断调用本地还是云端模型。
与此同时,由于推理能力部署在本地,企业一次性投入即可获得持续、稳定的算力供给。无论员工调用十次还是一万次,设备成本固定不变。
对于AI使用量大、调用频率高的企业来说,
通常在数月内即可收回成本,此后只需支付电费
。
是的,用得越多越划算,
三座专属于OPC的无限Token工厂。
△图为AI生成
整场直播将近一个小时,节奏很紧凑,我把精彩内容都梳理出来了,大家看完后感兴趣的话可以去找直播录屏。
先把这次发布的三款产品简单过一下。
1、联想百应AI主机mini 100,面向OPC及超级个体。
小身材大能力,专为OPC及超级个体打造。0.5L机身,日均耗电不到1度,运行噪音低,适合长时间放在办公桌旁运行。
数据存储和计算全在本地,同时支持多款云端模型自由切换。结合上下文智能压缩设计,执行市场分析报告类任务时Token成本直降70%到95%。
这款产品当天已发售,购机即送
2亿Tokens
。
2、联想百应AI主机300,面向专业领域的超级专家。
本地存储计算加本地35B原精度多模态大模型,边云混合智能调度,项目管理类任务Token成本比纯云端降80%以上。
而这一切,抛开设备投入外,
仅需日均三块的电费
。
这款产品现在可预约,618开售。月底前购买可获得五大权益:赠5亿Tokens、1次远程技术指导、1年7×24人工电话全天候响应、3年免费上门服务、1年硬盘数据恢复服务。
3、联想百应AI主机Pro 700,面向超级团队和成长型企业。
Max配置拉满版。
本地部署高至122B多模态大模型。本地推理并发提升8倍,推理可用性高达99.9%。
AI算力1000TOPS,搭载20核ARM处理器和128GB统一内存。
还有两个高级玩法。
一个叫「多机集联」
,多台Pro 700环形组网,算力叠加,模型更大、推理更快。
另一个叫「多虾纳管」
,企业里员工私下用的各种「龙虾」,可以统一纳入管理,自动进行商用级安全加固和精细化权限管控。
不过这款目前还处在客户合作试点阶段,预计9月底正式和市场见面。
多的就不说了。
产品好不好,最终还是得看实际场景应用。
联想确实也请了三位试点用户上台,分享他们内测期间有关百应AI主机的体验。
挺有代表性的,完全不同的三个阶段,完全不同的需求,也分别对应这次的三款百应AI主机。
我挑两位说。
维正。
00后,哈工大毕业,跨境电商创业者,年营收2000万。
上台时手上拿了个空气炸锅内胆,他说,光这一个单品,去年就卖了超过500万。
秘诀当然是AI,特别是在选品这一环节的赋能。
他用百应AI主机mini打通了7×24小时自动选品:爬平台数据、拆评论痛点、监控海外社媒舆情,不需要人盯盘。
营销方面也大幅提效。跨境电商面临的是一个碎片化市场,各个地区的文化截然不同,过去需要一个团队来运营,如今维正用AI就能全搞定了。
之所以选择百应AI主机mini,核心就是「开箱即用」。作为中小卖家,没预算聘请技术团队,如今联想把「软硬服」都封装好了。
秦文山,
网名AI画中画,苏州画宗人工智能创始人。
做AI短剧的,号称江苏AIGC视频领域OPC第一人。
这哥们挺有意思。
一年前还在苏州地铁上班,接触AIGC后辞掉国企工作搞AI短剧。
不到10人的团队,产出了50多部作品,合计近40小时的内容。
如今公司成立不到一年,整体估值过亿。而且是零融资,全靠自有业务盈利。
可能因为都是内容行业,我觉得他的AI工作流挺有意思,特别是关于任务分配方面的思考。
也是和百应AI主机的特色结合起来了。
剧本创作、人物设定、场景处理、字幕配音这些活儿,全扔到AI主机上本地跑;只有视频生成上云。
边云结合之后,
Token成本骤降40%,人工审核量大幅减少
。
算力定门槛,生态定成败
设备解决了算力问题。但
真正能让消费者买单的,还是生态
。
一台主机的价值天花板,取决于上面能跑多少个真正落地的
Agent、数字角色和Skills
。
联想百应2018年从IT服务起步,到2024年推出一站式智能体服务平台,再到今天伴随百应AI 3.0和AI主机发布,正式推出
百应AI生态2026
。
而关于这个新时代的生态建设,联想有
三层设想
。
底座层:
百应AI主机。同时,为推动Token Plan落地交付,联想首发Token Key(词元宝)。作为第一把开启词元经济时代的物理钥匙,词元宝即插即用、多层加密、指纹管控。
应用层:
围绕百应Claw展开,预装AI运维、AI办公等技能,通过内置Skills,共建Skills社区等核心能力。以此为基础,深入客户的实际场景应用,为客户交付丰富又实用的数字角色:通用数字角色覆盖营销、销售、客服、企业运营等通用场景;专业数字角色面向法律合规、工业设计、电商运营、供应链管理等垂直行业。
服务模式:
提供订阅化标准服务、轻定制服务,满足企业多样化需求。
不只是说说而已,联想在这件事上的野心非常大——
汇聚1万家以上服务交付伙伴,提供5万个以上数字角色,共建10万个以上Skills,最终服务500万家以上OPX。
划重点,不只是OPC,最后一个字母的想象空间是无限的。可以是公司、可以是部门、甚至可以就是单个个体。
赌的,就是一个从「卖设备」到「卖AI生产力」的商业模式转型。
为了达成这个目标,联想配套推出了
「星河计划」
。
预算相当夸张,可以说是下血本了。
营销:
超1亿人次全域曝光,品牌联合推广+流量扶持。
投资:
最高5000万投资支持,开放联想系投资平台路演等机会。
商业:
面向智能体服务交付伙伴,提供2026全年认证限免;面向数字角色伙伴,返还首年全部合作收入;面向skills伙伴,开放万亿级Token资源包激励。
到这,直播就接近尾声了。整场看完后,我不禁发出一声感叹——
Agent的战场,这次是真的开始向基础设施渗透了。
1450年,
古腾堡
把金属活字印刷彻底推向规模化。
在那之前,一本书的成本约等于一座小庄园。基础设施的更新,让平民也有机会成为作家,向全世界展示自己的才华。
2026年,AI主机想做的事情,本质上是一样的。
不是大公司才能用AI、不是有技术团队才能部署AI、不是烧得起钱才能享受AI……所有有想法的
Creator、Coder
,都应该尽可能多地把自己的Idea变成现实。
为此,他们需要一台AI原生的算力设备。
这是这个时代的印刷机。
版权所有,未经授权不得以任何形式转载及使用,违者必究。
Jay
「斯隆奖」得主戴亮全职加盟复旦
2026-05-28
清华有了新老师:黄仁勋
2026-05-28
卡帕西Anthropic最新头衔:技术员工(MTS)
2026-05-26
抢先李飞飞!世界模型能多人联机玩FPS游戏了
2026-05-19
扫码分享至朋友圈
热门文章
刚刚,国产AI自己造了AI,全球首例!
2026-05-26
卡帕西Anthropic最新头衔:技术员工(MTS)
2026-05-26
7B打败o3、GPT-5!医学AI智能体让模型学会“看哪里、怎么看”
2026-05-28
DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速
2026-05-28
面壁智能「开源周」:一场定义端侧 AI 终局的系统性「亮剑」
2026-05-29
关于量子位
加入我们
寻求报道
商务合作
扫码关注量子位
追踪人工智能新趋势,报道科技行业新突破
量子位 QbitAI 版权所有©北京极客伙伴科技有限公司
京ICP备17005886号-1
本文来源:量子位