别再骂 Claude 限速了,Anthropic Boris 亲口承认:最挑剔的用户,反而最离不开我们
点击查看原文>
在硅谷,越来越多开发者开始形成一种奇怪的工作状态:白天,他们像项目经理一样给 AI 分配任务,到了晚上,他们则像云计算调度员一样,同时运行数百个 Agent。
而这,正在成为 Anthropic 内部的真实日常。
最近,在《Big Technology Podcast》的一场长达近一小时的对谈中,Anthropic Claude Code 负责人 Boris 罕见系统性谈论了他们内部对 AI Agent、自动编程、SaaS、世界模型,以及“AI 自我改进”的真实看法。
这场采访的信息量极大。
采访中,Boris 反复提及了一个在其他访谈中透露过的信息:
“Claude Code 本身,现在已经是 100% 使用 Claude Code 开发的。”
而且,这件事从去年 Opus 4.5 时期就已经开始了。换句话说:Anthropic 内部已经出现了某种“AI 写 AI”的闭环。当然,Boris 也强调,目前还不是完全自动递归。
Anthropic 内部已经默认:“未来一定会朝这个方向发展。”
这场采访 Boris 还回应了一个特别现实的问题:大量用户抱怨 Claude Code 的 Token 限制。
很多人发现:AI 不是“不够聪明”,而是:“太能干活了。”于是 Token 消耗开始指数级暴涨。
Boris 表示,大部分用户其实并不会频繁撞到 Rate Limit,所以这个问题并没有外界想象得那么严重。当然,对于真正受影响的重度用户,他们也非常重视。

以下为访谈实录,经由 InfoQ 翻译及整理:
Claude Code 的爆发式增长
主持人:首先聊聊产品增长情况,如今增长势头十分迅猛。Anthropic 首席执行官 Dario Amodei 曾表示,公司产品年度需求暴涨 80 倍。去年同期双方交流时,公司年度营收达 40 亿美元就已令人振奋,如今预估营收已攀升至 450 亿美元,规模翻了十倍,需求更是暴涨 80 倍。目前企业正全力应对激增需求,想问问 Claude Code 在整体需求里占据多少份额,你观察到的用户规模与增长变化如何?
Boris:当下智能代理与人工智能工具的使用不再局限于 Anthropic 全系产品,Claude Code 更是出圈代表。公司拥有 Claude Code、Claude Design、Cowork 以及应用程序接口等多款产品,可供用户多元体验,但 Claude Code 成为多数用户接触品牌的首款产品。
它的增长速度超乎想象,内部内测阶段用户量就飞速上涨,还未对外正式发布时,我们就预判这款产品势必走红。去年五月 Opus 4、Sonnet 4 版本上线后,产品迎来指数级增长;十一月 Opus 4.5 版本、今年二月 4.6 版本、后续 4.7 版本接连迭代,每一次更新都推动增长再创新高。
团队不少成员深耕科技行业多年,见证过诸多高速成长的爆款产品,但从未遇到这般增速。目前团队正全力适配用户需求,力求稳住并持续提速发展,不断优化服务扩容能力。
主持人:一年前,Anthropic 人工智能模型的使用场景大多依托 API,比如咨询企业对接银行,借助模型整理核算数据这类商用场景。彼时接口使用量和营收占比遥遥领先,如今格局是否改变,Claude Code 的使用规模是否已经反超?
Boris:目前两类业务同步稳步增长,自研产品的业务占比相较去年大幅提升,产品端与接口端都处在高速扩张阶段,公司对两大板块均投入资源深耕。
公司创立初期,内部曾激烈探讨是否要自主研发面向用户的产品,如今事实证明自研产品价值显著,既能抢占市场关注度,也能助力人工智能安全研究。
团队人员规模有限,无法包揽所有业务,因此同时开放平台、智能代理、接口及软件开发工具包,赋能万千企业基于我们的技术自主开发应用。
主持人:看来两类业务处于均衡发展状态。想必你暂时不会披露当前哪一方体量更大。
Boris:现在还不是时候(笑)。
主持人:能看出 API 业务依旧保有规模,但自研产品的增长势头已经十分强劲,整体营收也跟着产品发展同步指数上涨。时至今日,还会有不少观众好奇 Claude Code 究竟是什么。我简单将它定义为:用日常口语就能搭建网站与软件的工具,但感觉这个定义不够全面。你会如何介绍这款产品?
Boris:这个概括基本贴切。多数人印象里人工智能就是对话聊天机器人,一年半前 Claude Code 问世前,大众与程序员也都是这般认知。
我们后续发现模型代码编写、工具调用能力大幅精进,这也是长期技术研发的核心方向,在一年半前正式具备商用价值。
以往程序员都依靠传统代码编辑器编写程序,我们大胆突破固有模式,打造出全新的编程形式。Claude Code 和普通聊天机器人的核心区别,就是具备工具调用能力。
聊天机器人仅能来回文字沟通,而 Claude Code 属于智能代理,可以自主调用各类工具完成操作。
主持人:能否举例说明可调用的工具?比如登录 Cloudfare 平台使用浏览器操作这类场景都包含在内吗?这款产品不再局限于自身固有功能,能够联动各类线上平台协同作业,是这样吗?
Boris:没错,它可以连通各类工具、浏览器以及本地电脑设备。早在一年半前,没有任何人工智能产品能直接修改本地电脑文件,而 Claude Code 率先实现文件编辑、桌面文件整理等操作。用户授权后,Claude Code 和 Cowork 工具均可执行这类操作,正是这细微的功能差异,彻底改变了产品使用方式与实用价值。
主持人:人工智能最初以文本补全为核心,依托大数据预判后续文字、代码内容,或是金融风险结果。如今技术迎来升级,用户输入自然语言指令后,智能体就能自主编写代码、调用工具完成任务。产品受众也从专业程序员,逐步拓展到普通用户。普通人也能借助 Claude Code 搭建程序、制作网站;也可以用它操作门槛更低的协同办公软件,操控电脑处理事务。举个例子,我可以直接下达指令预订出行航班即可。
Boris:确实如此。我近期就用协同办公工具批量预订机票。本月要前往伦敦、东京多地参与克劳德编程相关活动,行程站点繁多。
我告知工具出行时间与目的地,让它查阅邮件、日历核对行程,它主动找出两处遗漏行程,还修正了我填报错误的出行日期。随后我下达订票指令,期间正常处理自身工作,一小时后工具就完成八张机票、五家酒店的预订。仅有一家酒店选址不符要求,重新下达改签指令后也迅速调整完毕。我也时常亲自测试两款产品的实操性能。
我还会设定各类测试案例,把日常常用操作,放到不同模型里反复测试。随着模型持续迭代升级,如今我测出了有史以来最佳效果。Cowork 搭配 Opus 4.7 版本,才能实现这样的表现。
模型不断变强,人们就得不断调整对它能力的预期。一年前用过模型之后就不再接触的工程师,大概率会觉得它编码能力欠佳,不敢让它一次性编写多行代码,这确实是当时模型的真实水平。
如今再让这批人体验新版模型,感受会截然不同,性能提升翻天覆地。这是我接触过首款每月都实现能力跨越式升级的技术。使用者也得不断适应、反复尝试,抱着初学者心态去体验,挑战它从前做不好的事,新版本或许就能完美完成。
Token Max 是否存在泡沫?
主持人:按你所说,以往使用软件只能受制于固定界面,厂商为规模化设计产品,附带大量无关功能,操作流程繁琐,软件也无法贴合个人使用偏好。
如今模式彻底转变,智能代理可主动代为处理事务,按需打造个性化线上体验,这也是产品迎来爆发式增长的核心原因。
接下来我想理性探讨一番,火热需求里,多少是真实刚需,多少只是追捧热度?业内存在一种 Token 最大化刷量现象,想必你也有所耳闻。部分企业下达指标,要求员工尽可能调用 AI token、高频运行智能程序,还会依据 token 使用量排名奖惩,把 AI 操作任务当作考核目标。想听听你的看法,这类刷量行为在产品实际使用占比中高吗?
Boris:我认为 token 刷量并不占据主流使用比例。加入 Anthropic 前,我任职于 Facebook 母公司,当时也接触过这类 token 量化考核模式。我的工作负责统筹旗下全系产品代码质量,代码质量直接决定工程师工作效率。
过去依靠传统优化手段,团队耗费大量精力,全年人均效率仅能提升 1% 至 3%,已是不小突破。
而接入 Claude 模型后,包括我们公司在内的大量合作企业,员工工作效率直接实现数倍增长。自研 Claude Code 上线后,公司工程师代码产出量提升 250%,同时代码质量与稳定性始终保持稳定。
如今众多企业都想复刻这份效率红利。我的建议基本一致:第一,开放 token 使用权限,允许员工自由试验,不用每次调用都层层审批;
第二,给予员工试错空间。大家摸索全新工作模式、尝试各类优化思路时,难免出现失败,宽松的氛围才能催生创新与效率提升。
效率突破往往也出自意料之外的人员,普通财务、市场人员、新晋程序员,都可能挖掘出独特的自动化用法,这类潜力无法提前预判。
企业可以先放开探索尝试,出现成熟可用的场景后再针对性优化,不必过早约束限制。
各家企业文化不同,考核排名式激励、宽松自由式探索都可行,适配自身情况就好。
主持人:我日常也频繁调用 token,两款产品对我的工作助力很大。我属于个人从业者,背后仅有兼职团队协助。但看到行业现状不免心存顾虑,大型企业占据绝大部分 AI 使用预算,部分考核机制存在弊端。据《金融时报》报道,亚马逊员工为达成考核指标,刻意用 AI 处理无效任务,人为拉高 token 消耗量。公司要求八成以上开发者每周使用 AI,不少员工只好挂机运行无意义程序凑数。
你认为刷量并非需求主力,从你们后台数据来看,能否证实这只是个别现象,而非行业普遍情况?
Boris:我听闻过这类刷量趋势,但无法统计具体企业数量。我们客户群体数量庞大,整体使用量并非由单一企业拉动。抛开表面行为来看,企业推行这类考核,本质目的是推动组织架构与业务流程革新,真正让人工智能落地赋能企业发展。
这种情况其实很模糊,完全取决于企业本身 —— 每家公司业务、文化、组织架构和做事方式都不一样。
我特别喜欢一篇 90 年代《哈佛商业评论》的文章,题目记不清了,大意是:电脑都普及了,为什么没人看到生产力的提升?
这个问题在当时很关键。今天我们觉得 “电脑提高效率” 是理所当然,但在 90 年代并不是。那时个人电脑开始普及,取代大型机,价格降下来,普通公司、初创公司都买得起了。但矛盾点在于:大家买了电脑,却没看到效率提升。
那篇文章的核心观点是:要想从电脑中获益,必须把整个业务流程围绕电脑重构,让电脑成为核心。
如果还是纸质文件、档案柜、一堆抽屉,流程还是纸笔物理操作,电脑只是个边缘摆设,那根本不可能受益。
但如果你扔掉档案柜、扔掉纸质文件,把电脑放在中心,所有业务流程都在上面跑,你才能真正获益。当时公司分成两派:一派狠下心做了痛苦的转型,获得巨大收益;另一派没做,就没收益。我觉得现在 AI 也是一样。很多公司都在琢磨:怎么真正从 AI 的效率提升中获益?
大家都在试,各种方法都在探索。我不认为有唯一正确的答案。
Token 花完了,生产力真提升了吗?
主持人:好,聊完 “刷 token”,再聊 token 效率。Token 就是模型的输入输出(字 / 词片段),公司按这个计费,用得越多,数据中心需求越大、成本越高。模型越来越强,但我有时会怀疑:它们真的做到最高效了吗?
比如我最近一直在用 Claude Cowork 做 PPT,它确实很强,补充说下我用的是 Opus 4.7。但有一次我让它导出 PDF,它突然像“疯了一样”,不断循环调用工具,疯狂消耗 Token,却始终没法完成导出。最后我不断提醒它:“你已经做完 PPT 了,直接导出就行。” 然后它突然回复:“我得向你道歉。我钻进了一个其实并不存在的限制死胡同里。”
随后它终于成功导出了 PDF。
所以很多人会怀疑:这些模型是不是在用大量 Token 做本来很简单的事情?这种低效率是不是 AI Agent 的根本问题?
Boris:我们通常会从几个维度评估模型。第一是智能程度(intelligence);第二是速度(speed);第三是效率(efficiency)。
理想情况下,我们当然希望三者一起提升。但如果必须排序,我认为最重要的还是智能水平。即便一个模型暂时没那么高效,只要它更聪明、能完成更多事情,那依然是非常有价值的。因为效率优化通常是在“模型先变聪明”之后再进行。
我们一般是先提升能力,再优化效率。现在我们也在探索,如何把更多控制权交给用户,因为很多时候,用户自己比系统更清楚需要什么。
比如目前一种控制方式是“选模型”:
Opus:最大、最强
Sonnet:中间层
Haiku:最轻量
另一种方式则是“Effort(努力程度)”。Effort 这个词其实非常贴切,本质上就是:
“你希望模型为这个任务投入多少思考和计算资源?”
比如 Opus 4.7,如果你想最大化智能表现,可以设置为“Extra High”或者“Maximum effort”;
但如果你想节省 Token,也可以切换成 Medium 或 Low。这是用户可以主动控制的。
主持人:有人认为,像“导出 PDF 时陷入循环”这种问题,是语言模型架构天然决定的,根本无法彻底修复。你怎么看?
Boris:我不认同这个观点。我们把时间线拉长一点看。最早开始使用 Claude Code 的,其实是工程师。大概一年半以前,Agent 还没有普及到非工程师群体。
但如果回头看一年半前的 Claude Code,它其实并不好用。它能帮你写一点代码,但如果你真的让它独立完成一个完整功能,结果通常很糟糕。它也会陷入循环、逻辑混乱,代码质量很差,甚至根本跑不起来。
但后来它开始逐渐变好。
随着模型能力提升、Claude Code 产品本身迭代,结果越来越稳定、越来越可靠。
发展到今天:Claude Code 本身,已经是 100% 由 Claude Code 写出来的;Cowork 也是 100% 由 Claude Code 开发的;Anthropic 内部越来越多功能,也开始完全由 Claude Code 编写。
我们在客户那里也看到同样趋势。昨天我在 Y Combinator 做分享时,现场几乎所有创业者都在用 Claude Code。
我问他们:“现在有多少人的代码,已经 100% 由 Claude Code 编写?”大概一半人举手。
然后我又问:“有谁完全不用 AI 写代码?”全场大概只有一个人举手。
剩下的人基本都处于中间状态:大部分代码由 AI 编写,但不是全部。
而这一切,在一年前根本不可能。所以你现在看到 Cowork 的很多问题,本质上只是因为它还处于早期阶段。
它才发布几个月,未来一定会继续进化。
事实上,我认为今天所有在使用 Cowork 的人,都是“早期采用者”。甚至可以说,现在真正深度使用 AI 的人,整体都还属于早期用户。世界上绝大多数人,其实还没有真正体验过 AI 的能力。
主持人:你第一次看到 Agent 接管电脑、操作浏览器时,是什么感受?我第一次用的时候特别像第一次坐 Waymo 无人驾驶车。刚开始我死死盯着屏幕,生怕它做错什么,每一步都认真审核。但几分钟后,你就开始疯狂点“Approve”。最后你甚至开始低头玩手机,让 AI 自己干活。你的感受是怎样的?
Boris:这和我的体验非常像。
我最近就在观察一个非工程师朋友学习使用 Cowork。有一天,她电脑上的语言输入设置出了问题。以前她肯定会去 Google 搜:“这个问题怎么解决?”
但这次,她直接打开 Cowork。Cowork 说:“我来看看,可以操作你的电脑吗?”
她点击允许后,系统开始接管电脑,界面出现橙色高亮。然后你就能看到它:打开设置、检查语言输入器、诊断问题然后再自动修复,而且整个过程是透明的,用户始终能看到它在干什么,并不是后台偷偷操作。这种体验真的很“魔法”。
有意思的是,我当时的第一反应其实还是:去 Google 搜一下吧。”
但她已经自然地开始依赖 Cowork 解决问题了。
这让我越来越强烈地意识到:很多老用户,因为经历过早期版本,反而低估了这些产品的潜力。
而新用户往往会用 Claude Code 和 Cowork 做出很多我们自己都没想到的事情。每次看到这些用法,我都会被震撼到。
主持人:目前用户最大的抱怨之一,就是 Rate Limit(速率限制)。很多人 Token 用完后,只能等几个小时。Anthropic 怎么看这个问题?
Boris:这是我们正在重点解决的问题。但现实情况是,真正触达 Rate Limit 的用户,其实只占很小比例。当然,对 Max Plan 用户来说,这个比例会稍高一点。最近很多人抱怨,主要有几个原因。
第一,我们之前确实短暂降低过峰值速率限制,但后来已经回滚,而且现在实际上已经把额度翻倍了。第二,Claude Code 的扩展能力非常强。
用户会安装各种插件、集成各种工具,而其中很多插件其实非常浪费 Token。
现在我们正在做的一件事,就是把这些 Token 消耗透明化,让用户知道:“到底哪个插件在消耗你的额度。”
第三,也是最重要的一点:现在越来越多用户已经变成“重度玩家”。
刚发布 Claude Code 时,大家一次只跑一个 Agent。但现在,我自己电脑上经常同时跑五个。而每天晚上,我还会并行运行数百个,甚至上千个 Claude 实例。这在一年前是完全无法想象的。但显然,这也意味着 Token 消耗会暴涨。
现在很多用户都在探索新的工作流,而这些工作流本身就需要大量 Token。所以如果你真的需要无限额度,其实也可以直接走 API 计费模式。很多企业客户本来就是这么做的。
Anthropic 会输掉 Agent 市场吗?
主持人:说到数据中心投入,之前 Dario 聊过 OpenAI:他说自己在花钱上 “保持纪律”,但还是要砸几十亿美元建数据中心;而 OpenAI 在他看来是 “yolo(瞎搞、猛砸)”。
OpenAI 现在也在疯狂扩张数据中心、加大算力投入。外界会担心 Anthropic 过于“克制”,最终在 Agent 竞争中输掉市场。你怎么看?
Boris:首先,我们现在的增长速度,是 Anthropic 历史上最快的。Claude Code 的增长还在继续加速。而且因为大部分用户其实并不会频繁撞到 Rate Limit,所以这个问题并没有外界想象得那么严重。当然,对于真正受影响的重度用户,我们非常重视。
所以我们也采取了一些措施,比如我们已经把部分 Rate Limit 翻倍;今天也会继续提高每周额度;同时我们还上线了新的 Colossus 算力容量。
主持人:也就是来自 Elon Musk 的那部分算力资源?
Boris:对。因为这轮增长速度,真的远远超出了我们最疯狂的预测。对我们来说,最重要的是服务好用户。我们会尽一切努力去做到这一点。
主持人:OpenAI 推出 Codex 后,外界会认为 Anthropic 面临越来越激烈的竞争。你怎么看待这些“模仿者”和竞争对手?
Boris:我觉得行业里永远都会有模仿者,也永远都会有竞争对手。对我来说,这其实是一种“被认可”的表现。而且竞争会逼着所有人做得更好。
所以我最关心的事情,其实始终只有一个:如何尽可能把产品做好,真正服务好用户。我们鼓励团队里的每一个人每天都去和用户交流,然后每天都让产品进步一点点。
这是我最在意的事情。
主持人:你们似乎越来越强调,AI 不只是聊天机器人,而是真正“替用户行动”的 Agent。未来会怎么发展?我们刚刚聊到订机票、做营销演示文稿,现在你们甚至已经开始让 Claude Cowork 接管 QuickBooks,帮助小企业做记账。这件事最终会走向哪里?
Boris:对于 Claude Code 和 Co-work,我们现在主要在推进几个大的方向。第一,是持续提升模型智能。很多能力提升,本质上都来自模型本身的进化。比如在编程场景,以前只能写一行代码,后来可以写函数,现在已经能独立构建完整功能,甚至完整产品。
Cowork 也是一样。它刚推出时,可能只能帮你生成文档。但现在已经开始自动订机票、跨工具协同、操作 QuickBooks 以及完成更复杂的工作流。而且这个能力边界正在以极快速度推进。
主持人:除了能力提升之外,你们现在还在重点优化什么?
Boris:另一个重点,是“长时间运行任务”。最近我们推出了一个叫 Auto Mode 的功能。它本质上是为了替代以前那种频繁的权限弹窗。过去,每次 Claude 要调用工具时,系统都会问用户:“是否允许?”
但问题是,用户最终会被这些提示框搞疲劳。很多人后来根本不认真看,直接一路点:“允许”或者“始终允许”,但从安全角度,这其实很危险。
于是我们开始思考:与其让人类不断点击确认,不如让另一个 Claude 来审核。现在 Auto Mode 的逻辑是:当 Claude 想调用某个工具时,会先询问另一个 Claude:“这个操作安全吗?”
第二个 Claude 会拿到部分上下文,同时系统背后还有多层安全检查机制。为了做这件事,我们迭代了好几个月。内部有数千个 benchmark 和 eval 用来验证安全性。
最终结果是:无论在实验室测试,还是实际用户环境中,Auto Mode 都比之前“人工点击确认”的机制更安全。
对用户来说,它最大的好处是:你终于不用不停点“允许”了。而且安全性反而更高。
因为以前如果一长串操作里藏着一个危险命令,人类可能已经疲劳到直接点通过。但现在,第二个 Claude 不会轻易放行。
主持人:你们似乎也越来越强调“并行 Agent”。为什么这很重要?
Boris:是的,这是第三个非常重要的方向。我们很早就发现:真正的重度 Claude Code 用户,几乎不会只运行一个 Claude。
很多人会同时运行多个。从几个,到几十个,甚至上千个。而现在在 Cowork 上,我们也开始看到完全一样的趋势。当用户逐渐信任 Agent 后,他们会开一个任务、再开第二个、然后继续并行推进更多事情。
所以我们认为,这里面还有大量体验优化空间。包括:如何更自然地管理多个 Agent;什么场景适合并行;用户应该如何组织自己的工作流。这些都还是非常早期的问题。
主持人:你认为未来聊天机器人会从“回答问题”演变成“主动替用户执行任务”吗?比如我最近一直在和 Claude 聊印度旅行。我感觉未来的聊天机器人不会只是回答:“印度有哪些景点?”而是会进一步说:“我帮你把机票和行程一起订了吧。”也就是说,它会变得越来越主动。这是正确方向吗?
Boris:我觉得完全有可能。Agent 确实是未来方向。而且我们现在也在尝试很多类似的实验。
我们离完全自动化还有多远?
主持人:但另一方面,Anthropic 又在大量招聘 Salesforce 管理员、企业咨询顾问、Forward Deployed Engineer。很多人认为,这说明 AI 还远远不能完全自动化企业流程。Ethan Mollick 之前有句话特别有意思:“当 AI 公司真正相信 AGI 到来时,他们就不会再招聘那些帮助企业落地 AI 的咨询团队了。”他说:只要还需要人类做组织变革、系统集成、业务改造,那很多工作其实依然安全。你怎么看?
Boris:我自己的工作方式,其实已经很不一样了。我现在几乎不亲自写代码。我是在“Prompt Claude”。而更进一步的是:现在很多时候,我甚至不是直接 Prompt Claude。而是:“我有一个 Claude,专门负责去 Prompt 其他 Claude。”也就是说:我已经开始让一个 Claude 管理其他 Claude。在工程领域,我们已经看到一种巨大的“杠杆效应”。一个人的生产力正在被极度放大。
今天在 Anthropic,一个工程师能够支撑的业务规模、产品规模,已经远远超过过去。这种变化也开始出现在其他岗位:市场团队开始用 Claude;销售团队开始用 Claude;Forward Deployed Engineers 用 Claude Code 搭建企业方案;几乎所有岗位都在被 AI 放大。
但即便如此,我们依然缺“优秀的人”。
因为需求增长速度实在太快了。
所以今天真正的瓶颈,仍然是高质量人才。
主持人:但很多人还是会说,如果 AI 真这么强,那为什么企业还需要 Salesforce 管理员?为什么不能一句 Prompt 自动配置整个销售系统?
Boris:其实已经开始出现这种趋势了。团队里甚至有人开始用 Claude 报税。当然,我不一定推荐这么做。但我自己也确实试过:我把自己的税务数据同时给 Claude 和会计师处理,然后做结果对比。而且结果已经非常接近了。
但我觉得很多人忽略了一个核心问题:无论自动化程度多高,最终还是需要“人”来告诉 Claude:“你该做什么。”
即便 Salesforce 完全由 Claude 自动配置,也依然需要有人提出需求。
而未来的变化可能是:Claude 会越来越擅长“帮你指挥 Claude”。于是整个链条会越来越深:人输入 Prompt 给 Claude,Claude 再去 Prompt 其他 Claude,然后那些 Claude 再去协调更多 Agent。
但无论如何,仍然需要有人在最顶层驾驶这套系统。
主持人:所以未来人的工作,可能只剩下“提出正确问题”?
Boris:但那其实是极高杠杆的一件事。提出正确问题,本身就非常有价值。
主持人:现在硅谷开始流行一个词:“SaaS Apocalypse(SaaS 末日)”。很多人担心 AI 会摧毁传统软件公司。你怎么看?
Boris:我特别喜欢一本讲商业护城河的框架,叫《Seven Powers》。里面提到企业的几种核心护城河(Moat):
规模经济(Scale Economies)
网络效应(Network Effects)
切换成本(Switching Costs)
流程能力(Process Power)
等等。
我认为:未来并不是所有护城河都会消失。有些反而会变得更重要。比如“网络效应”。它的重要性会进一步提升。因为:不管是谁写代码,不管底层是不是 Agent,不管 AI 有多强,只要你的产品拥有网络效应,它依然强大。
但有些护城河会被削弱。例如“切换成本”。过去企业很难从 Vendor A 切到 Vendor B。但未来你可能只需要告诉 Claude:“帮我迁移过去。”而 Claude 会越来越擅长做这种系统迁移。
所以未来企业真正应该思考的问题是:“你的护城河到底是什么?”真正伟大的公司,往往不是只有一种护城河。而是拥有很多层护城河叠加。
未来只剩一家 AI 公司?
主持人:有人甚至认为,未来所有软件都会被 Agent 抽象成一个统一入口,最后可能只剩下一家 AI 公司。
Boris:这种情况当然有可能发生。但我觉得有点过于极端。比如即时通讯软件。今天我选择用哪个 App,不是因为它代码写得更好,而是因为:“我的朋友在那里。”
即便我今天可以用 Claude Code 在几小时内自己做一个聊天软件,它依然没意义。因为我联系不到别人。
主持人:但未来也许所有消息都会先经过 Agent,再由 Agent 统一帮你管理。
Boris:有可能。但底层通信协议仍然存在。比如像 Signal 这样的产品,它本质上依赖自己的协议。你可以做一个 Agent 帮你操作它,但并不意味着协议本身会消失。所以未来到底会演变成什么样,现在其实还远没有定论。
但我依然认为:很多传统护城河,在 AI 时代依然会继续存在,甚至变得更强。
主持人:你刚才提到很多商业护城河依然有效。比如制造业、基础设施,它们的规模效应不会因为 AI 消失?
Boris:对。比如像台积电这种制造企业。你想想它们为了优化生产流程、降低规模化成本,投入了多少年、多少资本。“规模越大,边际成本越低”,这是非常基础、非常强大的经济规律。很多制造业公司都建立在这种规律上。科技公司其实也一样。比如基础设施领域。
如果你建立了一个非常优秀的基础设施体系,那么随着用户规模增长,单个用户的边际成本会持续下降。这种规模效应依然非常强大。
所以即便未来人人都能自己构建 App,也不意味着这些护城河会消失。当然,我认为两种趋势会同时存在:AI 降低软件构建门槛;但真正深层的规模优势依然存在。
主持人:Anthropic 联合创始人 Jack Clark 最近说,他认为到 2028 年左右,AI 有 60% 的概率开始“自我改进”。你自己就在负责 Claude Code,而它已经能够自主写代码。你认同 Jack 的判断吗?
Boris:我觉得这个判断大体上是合理的。现在 Claude Code 本身,已经是 100% 使用 Claude Code 开发的。这个状态大概从去年 11 月、Opus 4.5 开始就已经成立了。
主持人:所以你认为,“快速自我递归增强(fast takeoff)”真的有可能发生?
Boris:有可能。而且这其实正是 Anthropic 存在的原因之一。如果你去问 Anthropic 的工程师或者研究员:“你为什么加入 Anthropic?”很多人都会回答:“为了 AI 安全。”
因为当我们思考未来时,真正最重要的事情是:我们必须确保这件事是安全的。尤其是为了下一代。
因为“AI 开始递归式自我增强”,确实是未来可能发生的一种结果。当然,现在还没有真正到那个阶段。目前的情况是:Claude Code 虽然已经在写 Claude Code,但仍然需要人类 Prompt。
它已经开始自己提出:“Claude Code 下一步应该开发什么功能。”但这些想法很多时候还不够好。目前大部分核心方向,依然是我在决定。不过未来某个时刻,模型会继续变强。然后整个系统会逐渐进入一种“自我强化循环(self-reinforcing loop)”。
“世界模型”之争
主持人:AI 圈现在还有一个很大的争论:Agent 是否必须拥有“世界模型(World Model)”?
Yann LeCun 一直认为:“大语言模型没有真正理解世界,它们无法预测行为后果,因此无法成为可靠 Agent。”他认为:LLM 只是不断预测下一个 Token,并不真正理解现实世界。而 Greg Brockman 则持相反观点,认为纯文本模型就足以通向 AGI。你站哪一边?
Boris:如果 Yann 愿意的话,我很乐意邀请他和我一起用 Claude Code 编程一个小时。然后你们可以把整个过程放到节目里。我很好奇他到时候会怎么想。也许他会改变观点,也许不会。
主持人:但从你的实际使用体验来看,你真的认为这些模型“理解后果”吗?你已经让 Cowork 帮你订了 8 趟航班、订酒店。如果你完全不相信它理解现实世界,你应该也不敢把信用卡交给它。
Boris:从 Anthropic 内部研究来看,一个非常令人惊讶的事情是:这些模型展现出的智能程度,远远超过人们原本预期。因为理论上,它们只是“预测下一个 Token”。听起来这是件很“愚蠢”的事情。你会觉得:
“一个只会猜下一个词的系统,怎么可能产生智能?”但实际上,我们已经发表了很多研究。研究发现,这些模型会规划(planning)、推理(reasoning)、提前布局以及长程思考,而这些能力,本来是人们完全没预料到的。
所以我不会轻易低估它们。
主持人:Anthropic 有个很著名的研究:模型在写诗时,第一句还没写完,就已经在“思考”下一句。这件事真的很诡异。
Boris:是的。但从某种角度讲,这其实也符合人类思维方式。如果是我写诗,我也会提前想后面一句。真正神奇的地方在于:你只是教它“预测下一个词”。但因为某些任务足够复杂,它最终被迫学会:提前规划、长程推理、组织结构和多步思考。
这是非常令人震惊的事情。
主持人:最后一个问题。你有没有想过,AI 也许只是一场“技术幻觉”?科技史上其实有很多被高估的浪潮。所以我一直在问自己:“这次到底是真正的未来,还是一种短期狂热?”有一种观点认为:普通人其实并不想和终端、Agent 打交道。他们更喜欢简单按钮、图形界面。而像 Claude Code 这种东西,可能太“技术化”了。它也许永远只适合开发者。你怎么看?
Boris:我们最近办了一场 Opus 4.7 Hackathon。获奖者里有医生、电工、木工,很多人完全没有编程背景。但他们依然用 Claude Code 做出了真正有价值的产品。
甚至还有一个人,在 Hackathon 之后直接把项目卖掉,成功创业。当然,一开始我们做 Claude Code 时,目标用户确实是工程师。最先学会使用它的也是工程师。但很快,非工程师群体也开始掌握它,并用它创造真正有经济价值的东西。实际上,如果你看今天很多使用场景,会发现:大量用户根本不是程序员。
但因为工具太有用了,他们愿意主动“跨过门槛”。甚至在 Cowork 还没出现之前,很多普通人第一次学习 Terminal,就是为了安装 Claude Code。
因为它真的足够有价值。现在当然更简单了:有桌面版;有 iOS App;有 Slack 集成;交互门槛正在快速下降。
但最关键的是:用户愿意主动折腾,只为了获得这种能力。对我来说,这其实就是最强的市场验证。真正重要的问题只有一个:“人们会不会每天持续使用它?”
而现在答案是:会。而且用户规模还在不断增长。最让我震惊的,是人们不断发明出新的使用方式。
参考链接:
https://m.youtube.com/watch?v=Z6IT4gjrcPE&pp=ugUHEgVlbi1VUw%3D%3D
本文来源:InfoQ