AI 资讯

别再骂 Claude 限速了，Anthropic Boris 亲口承认：最挑剔的用户，反而最离不开我们

点击查看原文>

AI_light

22 May 2026 • 37 min read

在硅谷，越来越多开发者开始形成一种奇怪的工作状态：白天，他们像项目经理一样给 AI 分配任务，到了晚上，他们则像云计算调度员一样，同时运行数百个 Agent。

而这，正在成为 Anthropic 内部的真实日常。

最近，在《Big Technology Podcast》的一场长达近一小时的对谈中，Anthropic Claude Code 负责人 Boris 罕见系统性谈论了他们内部对 AI Agent、自动编程、SaaS、世界模型，以及“AI 自我改进”的真实看法。

这场采访的信息量极大。

采访中，Boris 反复提及了一个在其他访谈中透露过的信息：

“Claude Code 本身，现在已经是 100% 使用 Claude Code 开发的。”

而且，这件事从去年 Opus 4.5 时期就已经开始了。换句话说：Anthropic 内部已经出现了某种“AI 写 AI”的闭环。当然，Boris 也强调，目前还不是完全自动递归。

Anthropic 内部已经默认：“未来一定会朝这个方向发展。”

这场采访 Boris 还回应了一个特别现实的问题：大量用户抱怨 Claude Code 的 Token 限制。

很多人发现：AI 不是“不够聪明”，而是：“太能干活了。”于是 Token 消耗开始指数级暴涨。

Boris 表示，大部分用户其实并不会频繁撞到 Rate Limit，所以这个问题并没有外界想象得那么严重。当然，对于真正受影响的重度用户，他们也非常重视。

以下为访谈实录，经由 InfoQ 翻译及整理：

Claude Code 的爆发式增长

主持人：首先聊聊产品增长情况，如今增长势头十分迅猛。Anthropic 首席执行官 Dario Amodei 曾表示，公司产品年度需求暴涨 80 倍。去年同期双方交流时，公司年度营收达 40 亿美元就已令人振奋，如今预估营收已攀升至 450 亿美元，规模翻了十倍，需求更是暴涨 80 倍。目前企业正全力应对激增需求，想问问 Claude Code 在整体需求里占据多少份额，你观察到的用户规模与增长变化如何？

Boris：当下智能代理与人工智能工具的使用不再局限于 Anthropic 全系产品，Claude Code 更是出圈代表。公司拥有 Claude Code、Claude Design、Cowork 以及应用程序接口等多款产品，可供用户多元体验，但 Claude Code 成为多数用户接触品牌的首款产品。

它的增长速度超乎想象，内部内测阶段用户量就飞速上涨，还未对外正式发布时，我们就预判这款产品势必走红。去年五月 Opus 4、Sonnet 4 版本上线后，产品迎来指数级增长；十一月 Opus 4.5 版本、今年二月 4.6 版本、后续 4.7 版本接连迭代，每一次更新都推动增长再创新高。

团队不少成员深耕科技行业多年，见证过诸多高速成长的爆款产品，但从未遇到这般增速。目前团队正全力适配用户需求，力求稳住并持续提速发展，不断优化服务扩容能力。

主持人：一年前，Anthropic 人工智能模型的使用场景大多依托 API，比如咨询企业对接银行，借助模型整理核算数据这类商用场景。彼时接口使用量和营收占比遥遥领先，如今格局是否改变，Claude Code 的使用规模是否已经反超？

Boris：目前两类业务同步稳步增长，自研产品的业务占比相较去年大幅提升，产品端与接口端都处在高速扩张阶段，公司对两大板块均投入资源深耕。

公司创立初期，内部曾激烈探讨是否要自主研发面向用户的产品，如今事实证明自研产品价值显著，既能抢占市场关注度，也能助力人工智能安全研究。

团队人员规模有限，无法包揽所有业务，因此同时开放平台、智能代理、接口及软件开发工具包，赋能万千企业基于我们的技术自主开发应用。

主持人：看来两类业务处于均衡发展状态。想必你暂时不会披露当前哪一方体量更大。

Boris：现在还不是时候（笑）。

主持人：能看出 API 业务依旧保有规模，但自研产品的增长势头已经十分强劲，整体营收也跟着产品发展同步指数上涨。时至今日，还会有不少观众好奇 Claude Code 究竟是什么。我简单将它定义为：用日常口语就能搭建网站与软件的工具，但感觉这个定义不够全面。你会如何介绍这款产品？

Boris：这个概括基本贴切。多数人印象里人工智能就是对话聊天机器人，一年半前 Claude Code 问世前，大众与程序员也都是这般认知。

我们后续发现模型代码编写、工具调用能力大幅精进，这也是长期技术研发的核心方向，在一年半前正式具备商用价值。

以往程序员都依靠传统代码编辑器编写程序，我们大胆突破固有模式，打造出全新的编程形式。Claude Code 和普通聊天机器人的核心区别，就是具备工具调用能力。

聊天机器人仅能来回文字沟通，而 Claude Code 属于智能代理，可以自主调用各类工具完成操作。

主持人：能否举例说明可调用的工具？比如登录 Cloudfare 平台使用浏览器操作这类场景都包含在内吗？这款产品不再局限于自身固有功能，能够联动各类线上平台协同作业，是这样吗？

Boris：没错，它可以连通各类工具、浏览器以及本地电脑设备。早在一年半前，没有任何人工智能产品能直接修改本地电脑文件，而 Claude Code 率先实现文件编辑、桌面文件整理等操作。用户授权后，Claude Code 和 Cowork 工具均可执行这类操作，正是这细微的功能差异，彻底改变了产品使用方式与实用价值。

主持人：人工智能最初以文本补全为核心，依托大数据预判后续文字、代码内容，或是金融风险结果。如今技术迎来升级，用户输入自然语言指令后，智能体就能自主编写代码、调用工具完成任务。产品受众也从专业程序员，逐步拓展到普通用户。普通人也能借助 Claude Code 搭建程序、制作网站；也可以用它操作门槛更低的协同办公软件，操控电脑处理事务。举个例子，我可以直接下达指令预订出行航班即可。

Boris：确实如此。我近期就用协同办公工具批量预订机票。本月要前往伦敦、东京多地参与克劳德编程相关活动，行程站点繁多。

我告知工具出行时间与目的地，让它查阅邮件、日历核对行程，它主动找出两处遗漏行程，还修正了我填报错误的出行日期。随后我下达订票指令，期间正常处理自身工作，一小时后工具就完成八张机票、五家酒店的预订。仅有一家酒店选址不符要求，重新下达改签指令后也迅速调整完毕。我也时常亲自测试两款产品的实操性能。

我还会设定各类测试案例，把日常常用操作，放到不同模型里反复测试。随着模型持续迭代升级，如今我测出了有史以来最佳效果。Cowork 搭配 Opus 4.7 版本，才能实现这样的表现。

模型不断变强，人们就得不断调整对它能力的预期。一年前用过模型之后就不再接触的工程师，大概率会觉得它编码能力欠佳，不敢让它一次性编写多行代码，这确实是当时模型的真实水平。

如今再让这批人体验新版模型，感受会截然不同，性能提升翻天覆地。这是我接触过首款每月都实现能力跨越式升级的技术。使用者也得不断适应、反复尝试，抱着初学者心态去体验，挑战它从前做不好的事，新版本或许就能完美完成。

Token Max 是否存在泡沫？

主持人：按你所说，以往使用软件只能受制于固定界面，厂商为规模化设计产品，附带大量无关功能，操作流程繁琐，软件也无法贴合个人使用偏好。

如今模式彻底转变，智能代理可主动代为处理事务，按需打造个性化线上体验，这也是产品迎来爆发式增长的核心原因。

接下来我想理性探讨一番，火热需求里，多少是真实刚需，多少只是追捧热度？业内存在一种 Token 最大化刷量现象，想必你也有所耳闻。部分企业下达指标，要求员工尽可能调用 AI token、高频运行智能程序，还会依据 token 使用量排名奖惩，把 AI 操作任务当作考核目标。想听听你的看法，这类刷量行为在产品实际使用占比中高吗？

Boris：我认为 token 刷量并不占据主流使用比例。加入 Anthropic 前，我任职于 Facebook 母公司，当时也接触过这类 token 量化考核模式。我的工作负责统筹旗下全系产品代码质量，代码质量直接决定工程师工作效率。

过去依靠传统优化手段，团队耗费大量精力，全年人均效率仅能提升 1% 至 3%，已是不小突破。

而接入 Claude 模型后，包括我们公司在内的大量合作企业，员工工作效率直接实现数倍增长。自研 Claude Code 上线后，公司工程师代码产出量提升 250%，同时代码质量与稳定性始终保持稳定。

如今众多企业都想复刻这份效率红利。我的建议基本一致：第一，开放 token 使用权限，允许员工自由试验，不用每次调用都层层审批；

第二，给予员工试错空间。大家摸索全新工作模式、尝试各类优化思路时，难免出现失败，宽松的氛围才能催生创新与效率提升。

效率突破往往也出自意料之外的人员，普通财务、市场人员、新晋程序员，都可能挖掘出独特的自动化用法，这类潜力无法提前预判。

企业可以先放开探索尝试，出现成熟可用的场景后再针对性优化，不必过早约束限制。

各家企业文化不同，考核排名式激励、宽松自由式探索都可行，适配自身情况就好。

主持人：我日常也频繁调用 token，两款产品对我的工作助力很大。我属于个人从业者，背后仅有兼职团队协助。但看到行业现状不免心存顾虑，大型企业占据绝大部分 AI 使用预算，部分考核机制存在弊端。据《金融时报》报道，亚马逊员工为达成考核指标，刻意用 AI 处理无效任务，人为拉高 token 消耗量。公司要求八成以上开发者每周使用 AI，不少员工只好挂机运行无意义程序凑数。

你认为刷量并非需求主力，从你们后台数据来看，能否证实这只是个别现象，而非行业普遍情况？

Boris：我听闻过这类刷量趋势，但无法统计具体企业数量。我们客户群体数量庞大，整体使用量并非由单一企业拉动。抛开表面行为来看，企业推行这类考核，本质目的是推动组织架构与业务流程革新，真正让人工智能落地赋能企业发展。

这种情况其实很模糊，完全取决于企业本身 —— 每家公司业务、文化、组织架构和做事方式都不一样。

我特别喜欢一篇 90 年代《哈佛商业评论》的文章，题目记不清了，大意是：电脑都普及了，为什么没人看到生产力的提升？

这个问题在当时很关键。今天我们觉得 “电脑提高效率” 是理所当然，但在 90 年代并不是。那时个人电脑开始普及，取代大型机，价格降下来，普通公司、初创公司都买得起了。但矛盾点在于：大家买了电脑，却没看到效率提升。

那篇文章的核心观点是：要想从电脑中获益，必须把整个业务流程围绕电脑重构，让电脑成为核心。

如果还是纸质文件、档案柜、一堆抽屉，流程还是纸笔物理操作，电脑只是个边缘摆设，那根本不可能受益。

但如果你扔掉档案柜、扔掉纸质文件，把电脑放在中心，所有业务流程都在上面跑，你才能真正获益。当时公司分成两派：一派狠下心做了痛苦的转型，获得巨大收益；另一派没做，就没收益。我觉得现在 AI 也是一样。很多公司都在琢磨：怎么真正从 AI 的效率提升中获益？

大家都在试，各种方法都在探索。我不认为有唯一正确的答案。

Token 花完了，生产力真提升了吗？

主持人：好，聊完 “刷 token”，再聊 token 效率。Token 就是模型的输入输出（字 / 词片段），公司按这个计费，用得越多，数据中心需求越大、成本越高。模型越来越强，但我有时会怀疑：它们真的做到最高效了吗？

比如我最近一直在用 Claude Cowork 做 PPT，它确实很强，补充说下我用的是 Opus 4.7。但有一次我让它导出 PDF，它突然像“疯了一样”，不断循环调用工具，疯狂消耗 Token，却始终没法完成导出。最后我不断提醒它：“你已经做完 PPT 了，直接导出就行。” 然后它突然回复：“我得向你道歉。我钻进了一个其实并不存在的限制死胡同里。”

随后它终于成功导出了 PDF。

所以很多人会怀疑：这些模型是不是在用大量 Token 做本来很简单的事情？这种低效率是不是 AI Agent 的根本问题？

Boris：我们通常会从几个维度评估模型。第一是智能程度（intelligence）；第二是速度（speed）；第三是效率（efficiency）。

理想情况下，我们当然希望三者一起提升。但如果必须排序，我认为最重要的还是智能水平。即便一个模型暂时没那么高效，只要它更聪明、能完成更多事情，那依然是非常有价值的。因为效率优化通常是在“模型先变聪明”之后再进行。

我们一般是先提升能力，再优化效率。现在我们也在探索，如何把更多控制权交给用户，因为很多时候，用户自己比系统更清楚需要什么。

比如目前一种控制方式是“选模型”：

Opus：最大、最强
Sonnet：中间层
Haiku：最轻量

另一种方式则是“Effort（努力程度）”。Effort 这个词其实非常贴切，本质上就是：

“你希望模型为这个任务投入多少思考和计算资源？”

比如 Opus 4.7，如果你想最大化智能表现，可以设置为“Extra High”或者“Maximum effort”；

但如果你想节省 Token，也可以切换成 Medium 或 Low。这是用户可以主动控制的。

主持人：有人认为，像“导出 PDF 时陷入循环”这种问题，是语言模型架构天然决定的，根本无法彻底修复。你怎么看？

Boris：我不认同这个观点。我们把时间线拉长一点看。最早开始使用 Claude Code 的，其实是工程师。大概一年半以前，Agent 还没有普及到非工程师群体。

但如果回头看一年半前的 Claude Code，它其实并不好用。它能帮你写一点代码，但如果你真的让它独立完成一个完整功能，结果通常很糟糕。它也会陷入循环、逻辑混乱，代码质量很差，甚至根本跑不起来。

但后来它开始逐渐变好。

随着模型能力提升、Claude Code 产品本身迭代，结果越来越稳定、越来越可靠。

发展到今天：Claude Code 本身，已经是 100% 由 Claude Code 写出来的；Cowork 也是 100% 由 Claude Code 开发的；Anthropic 内部越来越多功能，也开始完全由 Claude Code 编写。

我们在客户那里也看到同样趋势。昨天我在 Y Combinator 做分享时，现场几乎所有创业者都在用 Claude Code。

我问他们：“现在有多少人的代码，已经 100% 由 Claude Code 编写？”大概一半人举手。

然后我又问：“有谁完全不用 AI 写代码？”全场大概只有一个人举手。

剩下的人基本都处于中间状态：大部分代码由 AI 编写，但不是全部。

而这一切，在一年前根本不可能。所以你现在看到 Cowork 的很多问题，本质上只是因为它还处于早期阶段。

它才发布几个月，未来一定会继续进化。

事实上，我认为今天所有在使用 Cowork 的人，都是“早期采用者”。甚至可以说，现在真正深度使用 AI 的人，整体都还属于早期用户。世界上绝大多数人，其实还没有真正体验过 AI 的能力。

主持人：你第一次看到 Agent 接管电脑、操作浏览器时，是什么感受？我第一次用的时候特别像第一次坐 Waymo 无人驾驶车。刚开始我死死盯着屏幕，生怕它做错什么，每一步都认真审核。但几分钟后，你就开始疯狂点“Approve”。最后你甚至开始低头玩手机，让 AI 自己干活。你的感受是怎样的？

Boris：这和我的体验非常像。

我最近就在观察一个非工程师朋友学习使用 Cowork。有一天，她电脑上的语言输入设置出了问题。以前她肯定会去 Google 搜：“这个问题怎么解决？”

但这次，她直接打开 Cowork。Cowork 说：“我来看看，可以操作你的电脑吗？”

她点击允许后，系统开始接管电脑，界面出现橙色高亮。然后你就能看到它：打开设置、检查语言输入器、诊断问题然后再自动修复，而且整个过程是透明的，用户始终能看到它在干什么，并不是后台偷偷操作。这种体验真的很“魔法”。

有意思的是，我当时的第一反应其实还是：去 Google 搜一下吧。”

但她已经自然地开始依赖 Cowork 解决问题了。

这让我越来越强烈地意识到：很多老用户，因为经历过早期版本，反而低估了这些产品的潜力。

而新用户往往会用 Claude Code 和 Cowork 做出很多我们自己都没想到的事情。每次看到这些用法，我都会被震撼到。

主持人：目前用户最大的抱怨之一，就是 Rate Limit（速率限制）。很多人 Token 用完后，只能等几个小时。Anthropic 怎么看这个问题？

Boris：这是我们正在重点解决的问题。但现实情况是，真正触达 Rate Limit 的用户，其实只占很小比例。当然，对 Max Plan 用户来说，这个比例会稍高一点。最近很多人抱怨，主要有几个原因。

第一，我们之前确实短暂降低过峰值速率限制，但后来已经回滚，而且现在实际上已经把额度翻倍了。第二，Claude Code 的扩展能力非常强。

用户会安装各种插件、集成各种工具，而其中很多插件其实非常浪费 Token。

现在我们正在做的一件事，就是把这些 Token 消耗透明化，让用户知道：“到底哪个插件在消耗你的额度。”

第三，也是最重要的一点：现在越来越多用户已经变成“重度玩家”。

刚发布 Claude Code 时，大家一次只跑一个 Agent。但现在，我自己电脑上经常同时跑五个。而每天晚上，我还会并行运行数百个，甚至上千个 Claude 实例。这在一年前是完全无法想象的。但显然，这也意味着 Token 消耗会暴涨。

现在很多用户都在探索新的工作流，而这些工作流本身就需要大量 Token。所以如果你真的需要无限额度，其实也可以直接走 API 计费模式。很多企业客户本来就是这么做的。

Anthropic 会输掉 Agent 市场吗？

主持人：说到数据中心投入，之前 Dario 聊过 OpenAI：他说自己在花钱上 “保持纪律”，但还是要砸几十亿美元建数据中心；而 OpenAI 在他看来是 “yolo（瞎搞、猛砸）”。

OpenAI 现在也在疯狂扩张数据中心、加大算力投入。外界会担心 Anthropic 过于“克制”，最终在 Agent 竞争中输掉市场。你怎么看？

Boris：首先，我们现在的增长速度，是 Anthropic 历史上最快的。Claude Code 的增长还在继续加速。而且因为大部分用户其实并不会频繁撞到 Rate Limit，所以这个问题并没有外界想象得那么严重。当然，对于真正受影响的重度用户，我们非常重视。

所以我们也采取了一些措施，比如我们已经把部分 Rate Limit 翻倍；今天也会继续提高每周额度；同时我们还上线了新的 Colossus 算力容量。

主持人：也就是来自 Elon Musk 的那部分算力资源？

Boris：对。因为这轮增长速度，真的远远超出了我们最疯狂的预测。对我们来说，最重要的是服务好用户。我们会尽一切努力去做到这一点。

主持人：OpenAI 推出 Codex 后，外界会认为 Anthropic 面临越来越激烈的竞争。你怎么看待这些“模仿者”和竞争对手？

Boris：我觉得行业里永远都会有模仿者，也永远都会有竞争对手。对我来说，这其实是一种“被认可”的表现。而且竞争会逼着所有人做得更好。

所以我最关心的事情，其实始终只有一个：如何尽可能把产品做好，真正服务好用户。我们鼓励团队里的每一个人每天都去和用户交流，然后每天都让产品进步一点点。

这是我最在意的事情。

主持人：你们似乎越来越强调，AI 不只是聊天机器人，而是真正“替用户行动”的 Agent。未来会怎么发展？我们刚刚聊到订机票、做营销演示文稿，现在你们甚至已经开始让 Claude Cowork 接管 QuickBooks，帮助小企业做记账。这件事最终会走向哪里？

Boris：对于 Claude Code 和 Co-work，我们现在主要在推进几个大的方向。第一，是持续提升模型智能。很多能力提升，本质上都来自模型本身的进化。比如在编程场景，以前只能写一行代码，后来可以写函数，现在已经能独立构建完整功能，甚至完整产品。

Cowork 也是一样。它刚推出时，可能只能帮你生成文档。但现在已经开始自动订机票、跨工具协同、操作 QuickBooks 以及完成更复杂的工作流。而且这个能力边界正在以极快速度推进。

主持人：除了能力提升之外，你们现在还在重点优化什么？

Boris：另一个重点，是“长时间运行任务”。最近我们推出了一个叫 Auto Mode 的功能。它本质上是为了替代以前那种频繁的权限弹窗。过去，每次 Claude 要调用工具时，系统都会问用户：“是否允许？”

但问题是，用户最终会被这些提示框搞疲劳。很多人后来根本不认真看，直接一路点：“允许”或者“始终允许”，但从安全角度，这其实很危险。

于是我们开始思考：与其让人类不断点击确认，不如让另一个 Claude 来审核。现在 Auto Mode 的逻辑是：当 Claude 想调用某个工具时，会先询问另一个 Claude：“这个操作安全吗？”

第二个 Claude 会拿到部分上下文，同时系统背后还有多层安全检查机制。为了做这件事，我们迭代了好几个月。内部有数千个 benchmark 和 eval 用来验证安全性。

最终结果是：无论在实验室测试，还是实际用户环境中，Auto Mode 都比之前“人工点击确认”的机制更安全。

对用户来说，它最大的好处是：你终于不用不停点“允许”了。而且安全性反而更高。

因为以前如果一长串操作里藏着一个危险命令，人类可能已经疲劳到直接点通过。但现在，第二个 Claude 不会轻易放行。

主持人：你们似乎也越来越强调“并行 Agent”。为什么这很重要？

Boris：是的，这是第三个非常重要的方向。我们很早就发现：真正的重度 Claude Code 用户，几乎不会只运行一个 Claude。

很多人会同时运行多个。从几个，到几十个，甚至上千个。而现在在 Cowork 上，我们也开始看到完全一样的趋势。当用户逐渐信任 Agent 后，他们会开一个任务、再开第二个、然后继续并行推进更多事情。

所以我们认为，这里面还有大量体验优化空间。包括：如何更自然地管理多个 Agent；什么场景适合并行；用户应该如何组织自己的工作流。这些都还是非常早期的问题。

主持人：你认为未来聊天机器人会从“回答问题”演变成“主动替用户执行任务”吗？比如我最近一直在和 Claude 聊印度旅行。我感觉未来的聊天机器人不会只是回答：“印度有哪些景点？”而是会进一步说：“我帮你把机票和行程一起订了吧。”也就是说，它会变得越来越主动。这是正确方向吗？

Boris：我觉得完全有可能。Agent 确实是未来方向。而且我们现在也在尝试很多类似的实验。

我们离完全自动化还有多远？

主持人：但另一方面，Anthropic 又在大量招聘 Salesforce 管理员、企业咨询顾问、Forward Deployed Engineer。很多人认为，这说明 AI 还远远不能完全自动化企业流程。Ethan Mollick 之前有句话特别有意思：“当 AI 公司真正相信 AGI 到来时，他们就不会再招聘那些帮助企业落地 AI 的咨询团队了。”他说：只要还需要人类做组织变革、系统集成、业务改造，那很多工作其实依然安全。你怎么看？

Boris：我自己的工作方式，其实已经很不一样了。我现在几乎不亲自写代码。我是在“Prompt Claude”。而更进一步的是：现在很多时候，我甚至不是直接 Prompt Claude。而是：“我有一个 Claude，专门负责去 Prompt 其他 Claude。”也就是说：我已经开始让一个 Claude 管理其他 Claude。在工程领域，我们已经看到一种巨大的“杠杆效应”。一个人的生产力正在被极度放大。

今天在 Anthropic，一个工程师能够支撑的业务规模、产品规模，已经远远超过过去。这种变化也开始出现在其他岗位：市场团队开始用 Claude；销售团队开始用 Claude；Forward Deployed Engineers 用 Claude Code 搭建企业方案；几乎所有岗位都在被 AI 放大。

但即便如此，我们依然缺“优秀的人”。

因为需求增长速度实在太快了。

所以今天真正的瓶颈，仍然是高质量人才。

主持人：但很多人还是会说，如果 AI 真这么强，那为什么企业还需要 Salesforce 管理员？为什么不能一句 Prompt 自动配置整个销售系统？

Boris：其实已经开始出现这种趋势了。团队里甚至有人开始用 Claude 报税。当然，我不一定推荐这么做。但我自己也确实试过：我把自己的税务数据同时给 Claude 和会计师处理，然后做结果对比。而且结果已经非常接近了。

但我觉得很多人忽略了一个核心问题：无论自动化程度多高，最终还是需要“人”来告诉 Claude：“你该做什么。”

即便 Salesforce 完全由 Claude 自动配置，也依然需要有人提出需求。

而未来的变化可能是：Claude 会越来越擅长“帮你指挥 Claude”。于是整个链条会越来越深：人输入 Prompt 给 Claude，Claude 再去 Prompt 其他 Claude，然后那些 Claude 再去协调更多 Agent。

但无论如何，仍然需要有人在最顶层驾驶这套系统。

主持人：所以未来人的工作，可能只剩下“提出正确问题”？

Boris：但那其实是极高杠杆的一件事。提出正确问题，本身就非常有价值。

主持人：现在硅谷开始流行一个词：“SaaS Apocalypse（SaaS 末日）”。很多人担心 AI 会摧毁传统软件公司。你怎么看？

Boris：我特别喜欢一本讲商业护城河的框架，叫《Seven Powers》。里面提到企业的几种核心护城河（Moat）：

规模经济（Scale Economies）
网络效应（Network Effects）
切换成本（Switching Costs）
流程能力（Process Power）

等等。

我认为：未来并不是所有护城河都会消失。有些反而会变得更重要。比如“网络效应”。它的重要性会进一步提升。因为：不管是谁写代码，不管底层是不是 Agent，不管 AI 有多强，只要你的产品拥有网络效应，它依然强大。

但有些护城河会被削弱。例如“切换成本”。过去企业很难从 Vendor A 切到 Vendor B。但未来你可能只需要告诉 Claude：“帮我迁移过去。”而 Claude 会越来越擅长做这种系统迁移。

所以未来企业真正应该思考的问题是：“你的护城河到底是什么？”真正伟大的公司，往往不是只有一种护城河。而是拥有很多层护城河叠加。

未来只剩一家 AI 公司？

主持人：有人甚至认为，未来所有软件都会被 Agent 抽象成一个统一入口，最后可能只剩下一家 AI 公司。

Boris：这种情况当然有可能发生。但我觉得有点过于极端。比如即时通讯软件。今天我选择用哪个 App，不是因为它代码写得更好，而是因为：“我的朋友在那里。”

即便我今天可以用 Claude Code 在几小时内自己做一个聊天软件，它依然没意义。因为我联系不到别人。

主持人：但未来也许所有消息都会先经过 Agent，再由 Agent 统一帮你管理。

Boris：有可能。但底层通信协议仍然存在。比如像 Signal 这样的产品，它本质上依赖自己的协议。你可以做一个 Agent 帮你操作它，但并不意味着协议本身会消失。所以未来到底会演变成什么样，现在其实还远没有定论。

但我依然认为：很多传统护城河，在 AI 时代依然会继续存在，甚至变得更强。

主持人：你刚才提到很多商业护城河依然有效。比如制造业、基础设施，它们的规模效应不会因为 AI 消失？

Boris：对。比如像台积电这种制造企业。你想想它们为了优化生产流程、降低规模化成本，投入了多少年、多少资本。“规模越大，边际成本越低”，这是非常基础、非常强大的经济规律。很多制造业公司都建立在这种规律上。科技公司其实也一样。比如基础设施领域。

如果你建立了一个非常优秀的基础设施体系，那么随着用户规模增长，单个用户的边际成本会持续下降。这种规模效应依然非常强大。

所以即便未来人人都能自己构建 App，也不意味着这些护城河会消失。当然，我认为两种趋势会同时存在：AI 降低软件构建门槛；但真正深层的规模优势依然存在。

主持人：Anthropic 联合创始人 Jack Clark 最近说，他认为到 2028 年左右，AI 有 60% 的概率开始“自我改进”。你自己就在负责 Claude Code，而它已经能够自主写代码。你认同 Jack 的判断吗？

Boris：我觉得这个判断大体上是合理的。现在 Claude Code 本身，已经是 100% 使用 Claude Code 开发的。这个状态大概从去年 11 月、Opus 4.5 开始就已经成立了。

主持人：所以你认为，“快速自我递归增强（fast takeoff）”真的有可能发生？

Boris：有可能。而且这其实正是 Anthropic 存在的原因之一。如果你去问 Anthropic 的工程师或者研究员：“你为什么加入 Anthropic？”很多人都会回答：“为了 AI 安全。”

因为当我们思考未来时，真正最重要的事情是：我们必须确保这件事是安全的。尤其是为了下一代。

因为“AI 开始递归式自我增强”，确实是未来可能发生的一种结果。当然，现在还没有真正到那个阶段。目前的情况是：Claude Code 虽然已经在写 Claude Code，但仍然需要人类 Prompt。

它已经开始自己提出：“Claude Code 下一步应该开发什么功能。”但这些想法很多时候还不够好。目前大部分核心方向，依然是我在决定。不过未来某个时刻，模型会继续变强。然后整个系统会逐渐进入一种“自我强化循环（self-reinforcing loop）”。

“世界模型”之争

主持人：AI 圈现在还有一个很大的争论：Agent 是否必须拥有“世界模型（World Model）”？

Yann LeCun 一直认为：“大语言模型没有真正理解世界，它们无法预测行为后果，因此无法成为可靠 Agent。”他认为：LLM 只是不断预测下一个 Token，并不真正理解现实世界。而 Greg Brockman 则持相反观点，认为纯文本模型就足以通向 AGI。你站哪一边？

Boris：如果 Yann 愿意的话，我很乐意邀请他和我一起用 Claude Code 编程一个小时。然后你们可以把整个过程放到节目里。我很好奇他到时候会怎么想。也许他会改变观点，也许不会。

主持人：但从你的实际使用体验来看，你真的认为这些模型“理解后果”吗？你已经让 Cowork 帮你订了 8 趟航班、订酒店。如果你完全不相信它理解现实世界，你应该也不敢把信用卡交给它。

Boris：从 Anthropic 内部研究来看，一个非常令人惊讶的事情是：这些模型展现出的智能程度，远远超过人们原本预期。因为理论上，它们只是“预测下一个 Token”。听起来这是件很“愚蠢”的事情。你会觉得：

“一个只会猜下一个词的系统，怎么可能产生智能？”但实际上，我们已经发表了很多研究。研究发现，这些模型会规划（planning）、推理（reasoning）、提前布局以及长程思考，而这些能力，本来是人们完全没预料到的。

所以我不会轻易低估它们。

主持人：Anthropic 有个很著名的研究：模型在写诗时，第一句还没写完，就已经在“思考”下一句。这件事真的很诡异。

Boris：是的。但从某种角度讲，这其实也符合人类思维方式。如果是我写诗，我也会提前想后面一句。真正神奇的地方在于：你只是教它“预测下一个词”。但因为某些任务足够复杂，它最终被迫学会：提前规划、长程推理、组织结构和多步思考。

这是非常令人震惊的事情。

主持人：最后一个问题。你有没有想过，AI 也许只是一场“技术幻觉”？科技史上其实有很多被高估的浪潮。所以我一直在问自己：“这次到底是真正的未来，还是一种短期狂热？”有一种观点认为：普通人其实并不想和终端、Agent 打交道。他们更喜欢简单按钮、图形界面。而像 Claude Code 这种东西，可能太“技术化”了。它也许永远只适合开发者。你怎么看？

Boris：我们最近办了一场 Opus 4.7 Hackathon。获奖者里有医生、电工、木工，很多人完全没有编程背景。但他们依然用 Claude Code 做出了真正有价值的产品。

甚至还有一个人，在 Hackathon 之后直接把项目卖掉，成功创业。当然，一开始我们做 Claude Code 时，目标用户确实是工程师。最先学会使用它的也是工程师。但很快，非工程师群体也开始掌握它，并用它创造真正有经济价值的东西。实际上，如果你看今天很多使用场景，会发现：大量用户根本不是程序员。

但因为工具太有用了，他们愿意主动“跨过门槛”。甚至在 Cowork 还没出现之前，很多普通人第一次学习 Terminal，就是为了安装 Claude Code。

因为它真的足够有价值。现在当然更简单了：有桌面版；有 iOS App；有 Slack 集成；交互门槛正在快速下降。

但最关键的是：用户愿意主动折腾，只为了获得这种能力。对我来说，这其实就是最强的市场验证。真正重要的问题只有一个：“人们会不会每天持续使用它？”

而现在答案是：会。而且用户规模还在不断增长。最让我震惊的，是人们不断发明出新的使用方式。

参考链接：

https://m.youtube.com/watch?v=Z6IT4gjrcPE&pp=ugUHEgVlbi1VUw%3D%3D

本文来源：InfoQ