未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026

技术创新只是起点,产业整合速度才是AI落地的真正竞争力

未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026 – 量子位

首页

资讯

智能车

智库

活动

MEET大会

AIGC

扫码关注量子位

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026

允中

2026-05-24

14:14:05

来源:

量子位

技术创新只是起点,产业整合速度才是AI落地的真正竞争力

编辑部 整理自 AIGC2026

量子位 | 公众号 QbitAI

从硅谷投资人的视角望出去,AI的叙事正在悄然换轨。

在这个新旧周期交替的关键节点,

Fusion Fund创始合伙人张璐

带来了她一线的判断:

过去两年,行业所有的目光都聚焦在模型和算力上,但真正的战场,正在向基础设施的“通信层”和物理世界的“数据层”转移。

在本次2026中国AIGC产业峰会上,她将这一轮AI叙事的转向说得很直白——

推理

将超越训练,成为算力消耗的新主角;而数据中心里那个鲜少被提及的通信环节,其耗电量可能是计算本身的

百倍

以上。

至于下一个真正值得押注的方向,在她看来,并非更大的模型,而是

更真实、更高质量的数据

,以及

医疗、太空、纳米机器人

这三个AI应用方向。

为了完整体现张璐的思考,在不改变原意的基础上,量子位对演讲内容进行了翻译和编辑整理,希望能给你带来更多启发。

2026中国AIGC产业峰会是由量子位主办的行业峰会,近20位产业代表与会讨论。线下参会观众超千人,线上直播观众近400万,获得了主流媒体的广泛关注与报道。

核心观点梳理

算力需求的重心正在从训练转向推理

:训练是一次性的算力投入,推理才是可持续的长期需求;随着智能体交互替代对话交互,推理算力的比重将从现在的50%继续攀升,成为AI基础设施最核心的优化方向;

数据中心的真正电老虎是通信:在AI数据中心内,通信消耗的电量可能比计算本身高出百倍,这意味着光学通信等新一代通信技术的价值,远比通常认知的更为关键;

物理AI现在卡在数据层:架构和算力都已具备,真正的瓶颈是缺乏足够高质量的真实世界数据;合成数据可以作为补充,但无法替代边缘场景中的真实采集;

数据的质量比数量更重要,而医疗恰恰是高质量数据密度最高的行业之一:这是大量AI科技公司在2025年集中入局医疗赛道的底层逻辑,而不只是因为它市场够大;

技术创新只是起点,产业整合速度才是AI落地的真正竞争力:当500强企业的AI预算从千万级跃升至数十亿级,采购周期从半年压缩到一两个月,这种加速度本身就是模型和应用持续迭代的燃料。

以下为张璐演讲原文:

AI叙事的新拐点

大家好,我是张璐,我是硅谷Fusion Fund的创始和管理合伙人。

在过去的十到十一年的时间里,我们一直专注北美市场早期科技公司的投资,尤其专注在三个领域——

企业级人工智能、医疗AI以及工业自动化

过去两年,大家可能都关注到了,硅谷经历了快速迭代的创新周期,尤其是以人工智能为驱动的快速的产业创新以及产业植入的进程。

所以我们在过去这两年非常辛苦,但也非常兴奋,看到了很多杰出的企业家、创业者快速地成长起来,也看到了产业中从人工智能、基础设施,再到人工智能的应用层面上多重创新的开展和发展。

到今年,我觉得已经进入到了一个新时期,可以看到人工智能在整体的叙事上、创新的专注层面上,有了一些新变化。

所以今天也非常高兴有机会和大家分享,过去一年我们看到的硅谷新兴的人工智能创新风向的变化,以及一些最新的动态。

过去几年,我们在聊到人工智能创新的时候,有几个关键词反复出现,比如大语言模型、生成式AI、训练、算力需求等等。

但最近这段时间,我们看到在语境层面上也有一些新的转向,比如,不只是在讨论大语言模型,现在更多在讨论

行业专属应用

,基于的是小语言模型怎么样可以通过更加低成本、高效的方式,去进行产业垂直人工智能的植入,另外也是模型对象的转变。

从语言模型,现在更多讨论的是

物理AI

,还有

世界模型

的调整。

同时在计算层面,我们也经常讲到人工智能的算力需求非常巨大,以前算力的大量消耗可能是在训练端。

但过去这段时间,大家更多讨论的是

推理

对于算力的需求会越来越大,甚至

超过训练

,成为长期可持续的算力需求。

在根本层面上,我们也能看到有越来越多对于

数据

的讨论,从最早我们经常讲规模定律(Scaling Law),认为有越多的数据意味着可以去训练出更好的人工智能模型。

到现在大家更多关注

数据的质量——怎么样可以拿到高质量的行业数据?怎么可以通过高质量的行业数据去做更好的数据库?我们称之为数据治理(data curation),还有数据图书馆(data library)。

再基于这些数据的质量去优化人工智能,无论是模型能力,还是在应用能力上进行迭代。

重新定义AI基础设施

今天也想根据这些不同的方向,跟大家快速分享几个我们非常看好、而且现在正快速发展的人工智能领域。

首先要跟大家分享和聊到的就是

人工智能基础设施

如果大家有关注英伟达3月的GTC大会,也能看到英伟达的叙事在改变,以前讲的是一家GPU芯片企业,到现在黄仁勋已经非常明确——

英伟达是一个

人工智能基础设施公司

,一个

人工智能工厂

从Token经济学来看,未来对人工智能基础设施的需求,可能就像对电力的需求一样常见,这是一场非常巨大的基础层级的产业革命。

所以我们看到,对于人工智能基础设施的创新需求非常高。人工智能现在进入了

产业部署

阶段,大规模的产业部署也需要非常强力的

人工智能基础设施来辅助和支持

现在有大量新建的人工智能数据中心,它们面临很多挑战,比如

电力的消耗、通信层面上的能量消耗

,还有各种各样技术问题。

所以怎么样在这个层面上进行更多的技术创新,也带来了很多的创新机会,其中我们聊得比较多的,就是

基础设施本身的算力优化

我刚才提到,核心的算力变化在于——以前算力关注更多的是训练本身,但现在我们看到一个非常清晰的转变:训练更多是一次性的算力投入,但是

推理是可持续的算力需求

几年前,这两个层面上对算力的需求——训练的算力需求占到70%以上,推理可能只有20%到30%,现在推理已经占到了

一半

,在未来可能会变成

30:70(训练:推理)。

尤其我们现在已经到了新的转变阶段,即从聊天对话这种交互方式,到现在智能体的交互。如果你有一个智能体,你是不是希望这个智能体一直在线,一直响应你?

这个过程中对于推理的需求就更加具有可持续性,然后也更加大量,这个过程中

推理所消耗的算力也更为核心

因此,怎样进行推理的优化?怎样进行推理算力的优化?

是未来人工智能基础设施要去解决的核心问题之一。

我们刚才主要专注的是说计算这部分的算力,在人工智能基础设施层面上大家探讨的,更多是在计算过程中消耗了多大的能量。

现在全世界都在讨论,人工智能的核心发展瓶颈之一就是

耗电量

,但是在计算之后,下一步是什么呢?是通信(Communication)。

这个通信的过程中有通信能力的需求,有内部通信, 还有交换机(switch)的需求,在人工智能的数据中心里,通信环节整体的耗电量可能比计算的耗电量要

大几十倍甚至上百倍

我去年有幸在斯坦福,和我们之前的老校长,也是谷歌的母公司Alphabet的董事会主席John Hennessy做过一个对话,在对话中他专门提到——

在通信的过程中所消耗的电量可能比计算本身要

超过百倍以上

CPU、GPU的设计思路,其实是尽量在本地、在芯片本身做尽量多的计算,而不是去进行更多的传输,你可以把计算到处部署,也可以把数据到处挪动,但是

挪动数据的过程中它消耗的电量

,比移动计算本身的成本更高。

所以这也催生了很多新技术,它们所关注的正是通信的部分——怎么样可以有新一代的通信技术?我们经常提到,现在有很多新创新是在

光学通信

层面上,去大规模降低通信过程中的能量消耗,这也是很关键的。

我们刚才也提到一个

转变

,就是从

语言模型→世界模型→物理AI

到物理AI,我们所应用到的数据不只是文本数据,还有很多三维的数据、真实世界的数据,而这些数据的量级也更加巨大。

在这个过程中如果你再去到处传输数据,它对于能量的消耗也会更加巨大。

这也是为什么我们在这个领域会看到更多创新。

物理AI的突围:边缘计算与新型传感器

刚才我提到了好多次“物理AI”。

物理AI现在也是一个新兴发展的方向,它不只是我们经常讲的

人形机器人。

物理AI, 它其实涉及到了仿真模拟(

simulation)

,还有

数据层、世界模型

等领域,这些都覆盖到物理世界和AI的交互。无论是大家可能关注比较多的无人驾驶,还是工厂领域高精度生产的整体物理AI的投放和使用,还有医疗、物流供应链、太空行业等等,都在大规模应用物理AI。

怎么样可以让物理世界和AI更好地互动?

这也是现在创新很重要的方向。

我们看到很多创新其实聚焦在一个是仿真模拟层,另一个就是

数据层

现在对于物理AI来讲,最大的一个瓶颈,是我们的架构做好了,也有算力,但现在最缺的就是

数据

,现在最大的瓶颈也是在数据。

我们没有足够高质量的真实世界数据去支持物理AI的模型训练,当然这个过程中有很多人去聊一个相关方向,就是

合成数据

合成数据现在也是发展速度很快的一个方向,包括通过合成数据再去看去支持仿真模拟, 但在这个过程中会发现,合成数据其实存在很多弊端或者盲点。

所以,对真实世界中边缘场景、边缘数据的收集,还是非常关键的。

这也就意味着,我们不只是要去关注模型层的技术发展,要更努力去投入

新型的数据收集平台

数据优化平台的技术创新

,这样才可以有更好的数据库,去支持物理AI进一步的发展。

既然物理AI现在核心的一个痛点,就是它的数据层。那怎么样可以获得真实世界和工业界的高质量数据?

这个时候你会发现,比如传统的制造生产行业,它其实产生了很多高质量的真实三维数据,但是它的痛点在于,没有一个非常好的数据收集平台去进行标准化的数据收集、数据优化和数据治理(curation),让数据整体达到可以进行人工智能模型训练的阶段。

而在这个过程中,因为很多真实世界的需求,应用场景又对这样的数据收集平台的消耗,有着天然的限制。

所以

怎样可以在边缘端更好进行人工智能的部署

,也是非常重要的一个方向。

在这里我提到一个新的技术,就是我们看到了很多年一直在发展的

人工皮肤

,它核心是

柔性电路

,叫Flexible Electronics。

△来自斯坦福大学官网

今年出现了很多这样的公司,其中做得最好的研究之一,是来自斯坦福大学鲍哲南

教授的实验室,他们所做的

人工皮肤的传感器,是一款高精度、低能耗的传感器,它可以薄到就像手套一样,无论是套在机械手上,或者套在人的手上,它的触觉有非常高精度的传感点,这个触觉数据,就可以成为非常重要的数据来源,去支持物理世界。

△援引自中国科学院学部

在这个过程中,我们不只看到初创企业在做

新型的数据收集平台

我们在和一些500强企业,尤其是一些500强的制造龙头企业对话的时候,我发现他们自己内部也在做这方面技术的探索,所以说大家其实意识到了核心的瓶颈是在数据层,也有更多的创新聚焦到数据这一层。

我还想再强调一点,就是

边缘计算

边缘计算未来的发展也会非常快,这个方向对我们来说已经不是新方向了,我们从2018、2019年就开始投资边缘计算。

在过去两年,我觉得产业形成了一个共识——人工智能发展的未来方向是

在边缘端的人工智能部署

怎么样能够达到边缘端人工智能的部署?又回到我们刚才涉及到的问题,它需要的是一个

小模型

比如说我们今年有一家公司刚被高通收购,他们的模型就可以小到——

不足10亿token

, 在这样的情况下,你可以在一个Raspberry Pi(树莓派)上面去运行这个小模型,它就可以有和GPT-4同等的人工智能能力。

包括前段时间,谷歌发布的一些开源模型,也有一些非常小的边缘模型,所以在边缘端的人工智能铺设非常重要。

而边缘端AI的铺设,再和新型的数据收集平台整合到一起,我们就可以在边缘端进行数据收集、本地化处理和本地化的人工智能的应用,所以对于高监管行业,还有那些对数据隐私相对敏感的行业来说,都是非常好的发展方向。

关注三个应用方向:医疗、太空与比细胞还小的机器人

最后,跟大家讲几个我非常看好的具体人工智能应用方向。

今年对于硅谷来讲是

人工智能医疗

领域非常重要的一年,在年初的时候,先是礼来(美国制药公司)和英伟达成了一个

10亿美金

的合作。

△来自英伟达官网

他们的合作不只是人工智能和医疗的结合,他们也希望构建一个

人工智能+医疗+数据技术的生态

,去帮助更多的初创企业跟他们达成战略合作,我们有好几家公司跟他们在进行合作。

包括在1月份,大家可能有关注到,无论是ChatGPT还是Claude,都发布了针对医疗领域应用的专属产品,尤其是Claude做的Claude for Health,其实是专注底层的基础设施,在数据、隐私、安全,还有合规层面上去帮助医疗领域的服务提供商和医院等等,更好地进行AI医疗的整合。

前一段时间,大概几周前,默克(美国的制药企业,世界上最大的制药企业之一)也和谷歌Gemini发布了非常重磅的战略合作。所以我们会看到,很多人工智能的科技企业都在纷纷入局医疗领域。

医疗领域不只是美国市场最大的市场之一(美国20%的GDP都在医疗领域),更重要的一点,是我们刚才提到的很重要的一个转变,或者说共识——大家意识到

数据的质量比数据的量更重要

哪个行业有海量的高质量数据?其中一个很重要的行业就是

医疗

领域。

2017年我们就开始发布AI医疗的报告,去年又做了一个最新版,可以看到很多新的进化。

到现在,我们会看到很多新型的AI医疗公司,它专注的是一个

垂直领域小模型

比如说专门针对细胞疗法做一个垂直AI模型,针对MRA(磁共振血管造影)的测序数据专门做一个垂直模型,甚至还有一些是针对特定疾病的,比如说专门针对帕金森、老年痴呆,去结合各种各样的数据、生物信息学进行个性化的诊断和治疗。

这个过程中,不只是AI模型,还有包括

机器人和物理AI

也在医疗领域进行大规模的铺设。

这里我提到一家公司叫

Medra

, 也是我们去年刚投资的一家公司。

他们是

斯坦福

背景的团队,做了整一套的物理AI系统,从AI层面上可以自己去理解怎么样进行生物医疗的实验设计,同时进行机械手臂、还有自动化机器人实验,到最后整体去自动化整个生命科学,包括医疗领域的科研过程。

几周前,他们刚刚在旧金山,开启了他们全球现在最大的一个全无人物理AI机器人的实验室,现在正在昼夜不停进行各种各样的实验搭设。

这家公司在早期的时候就和很多药厂合作,所以现在我们去聊AI医疗,已经不是几年前单纯的问诊、医生辅助功能,现在已经涉及到了非常核心的个性化治疗部分。

个性化治疗也不只是我们之前可能看得比较多的癌症、心脑血管疾病,现在尤其是

脑部疾病

,例如帕金森、老年痴呆、抑郁症,这些都可以和AI、甚至物理AI进行深度整合。

另外一个我个人非常看好的方向就是——

物理AI和太空科技的结合

,尤其是未来3-5年整个太空领域的发展,太空经济学、太空生态、太空基础设施的崛起都会非常快速。

当然大家现在都在关注马上要到来的SpaceX的IPO,这也是非常强大的信号,会让大家看到接下来的三五年整个太空经济的快速崛起,又因为太空生态的特殊性,它就有天然的AI原生和机器人原生的特性。

比如说我们会讲到

太空基础设施的搭设

,在这个过程中就会用到很多物理AI, 还有机器人的创新应用,同时包括未来一个很大的发展方向,就是

太空工厂

当然你可以运送人上去太空工厂,但是可能更好的选择是在短期内运送机器人上去。比如现在探月的任务,你会发现在人类进行登月的尝试之前,会部署很多的机器人和机械设备。

我们自己也有投资专门做太空基础设施的公司,尤其是机器人层面上的应用,去进行这种效能提升。

例如

太空加油站

,所有设备都已经做好了,而且在过去的这一年时间就已经达到了

上亿美元

的订单收入。所以这个产业的快速迭代发展,也是一个非常新兴的、迭代非常迅速的人工智能创新方向。

最后一个方向其实也跟医疗相关,但它需要一定时间去成熟、但会让大家觉得非常兴奋的方向——

就是以更小的维度去看机器人的发展,我们叫它

微米机器人或者纳米机器人

更小的机器人可以进到人类的血管里,比如说去清除血栓;或者更进一步缩小到DNA级别,去进行靶向药物递送,实现体内的免疫隐形。

现在有越来越多的技术在这个方向进行迭代,比如说进行血栓清除的微米机器人,已经进入商业化应用的初始阶段。包括DNA引擎、Nanoswimmer(纳米机器人领域的一个细分形态,指会游泳的纳米级机器人),还有靶向递药的这些纳米机器人的应用,在未来几年也会有很好的前景和快速的发展。

所以今天就和大家快速地分享一些在过去这一年多的时间里,我们看到的一些让人很兴奋的AI发展方向。

现在整个生态也处在迭代期,还有很多新的模型架构在涌现。

当然这个过程中整个AI生态也面临很多挑战,但对于创业者来讲,

挑战就意味着机会

,所以我们会看到更多优秀的创业者,跳到产业里去开展新方向的探索。

作为投资人我们也非常幸福,我觉得现在对早期的AI的投资人来说,是很幸福的时刻,可以看到这么多的技术,不仅是处在创新的阶段,还处在产业快速迭代的时代。

最后想跟大家分享的就是,除了技术创新之外,现在更重要的一个时间节点,就是从今年开始我们会看到产业对于

技术整合

的态度在快速变化。

我们看到大量500强企业在人工智能方面的预算,从几千万变到几亿,甚至变到了

几十亿

。从以前销售周期可能需要半年甚至更长的时间,到现在

一个月、两个月

的时间,这种

产业的快速整合

才是人工智能技术能够快速发展的核心竞争力。

因为只有到达真实的应用场景,快速获得用户,或者说得到应用场景的反馈,获得高质量的产业数据,才可以让我们的模型架构和应用不断迭代。

所以也非常期待接下来这一年会有更多新的创新出现,也欢迎大家有时间可以多来硅谷,进行更多技术层面上的交流,谢谢。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

AIGC产业峰会

允中

联想集团Q4营收利润双创新高,兑现历史最佳财年

2026-05-22

8岁小学生idea直接变应用,秒哒3.0刚刚把AI应用门槛打没了

2026-05-13

打破科技数据壁垒!智会心研官宣:高级检索+AI深度分析,面向个人免费开放!

2026-05-09

腾讯开源手机端离线翻译模型,仅0.4G,支持33种语言

2026-04-29

扫码分享至朋友圈

相关阅读

科大讯飞高建清:「底座+能力+应用」是科大讯飞AIGC整体布局的三层架构|中国AIGC产业峰会

ChatGPT引发的创新,让AI在逻辑推理、文本生成上都有了很大的进步

明敏

2023-04-27

AIGC产业峰会

科大讯飞

万字梳理中国AIGC产业峰会激辩,大模型应用最全行业参考在此

后续还有详细版内容分享哦~

衡宇

2024-04-18

AIGC

AIGC产业峰会

微软关玮雅:每个应用程序都可以由 AI 来驱动 | 中国AIGC产业峰会

微软大中华区首席战略官解读AIGC的三大创业路径

梦晨

2023-04-29

AIGC产业峰会

微软

印象笔记唐毅:AI如何升级你的“第二大脑”|中国AIGC产业峰会

用“复合AI系统”设计AI应用

衡宇

2024-04-22

AIGC产业峰会

AI应用

复合AI系统

澜舟科技周明:大模型正在催生新AI中台 | 中国AIGC产业峰会

OpenAI和微软做对了3件事:看到未来、发挥所长、互相成就

鱼羊

2023-04-28

AIGC产业峰会

周明

澜舟科技

阿里林俊旸:大模型对很多人来说不够用,打造多模态Agent是关键 | 中国AIGC产业峰会

智能模型应融入对视觉/语音的理解

克雷西

2024-05-04

AIGC产业峰会

热门文章

Agent、多模态、应用、算力一天看尽,峰会亮点在此|5.20日,来现场一起AI

2026-05-17

一只机器狗,把英伟达的算力王座拱翻了

2026-05-17

AI水论文封一年,署名连坐!arXiv最严新规来了,陶哲轩附议

2026-05-18

openJiuwen社区开源新招:重磅发布JiuwenSwarm,拉开群体智能“养蜂”序幕

2026-05-18

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布,融资持续提速

2026-05-20

关于量子位

加入我们

寻求报道

商务合作

扫码关注量子位

追踪人工智能新趋势,报道科技行业新突破

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司

京ICP备17005886号-1


本文来源:量子位