量子位专访陶哲轩:我为什么现在创办一个AI x Science组织
未来可能会有10000个陶哲轩
量子位专访陶哲轩:我为什么现在创办一个AI x Science组织 – 量子位
首页
资讯
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">
量子位专访陶哲轩:我为什么现在创办一个AI x Science组织
西风
2026-03-14
14:34:18
来源:
量子位
未来可能会有10000个陶哲轩
Jay 发自 凹非寺
量子位 | 公众号 QbitAI
数学家陶哲轩,公开了AI新身份——
SAIR Foundation联合创始人
。
之前,他是举世闻名的数学天才,年少成名的传奇数学家、13岁加冕IMO的最年轻金牌得主……24岁就成为加州大学洛杉矶分校(UCLA)史上最年轻的
终身正教授
。
最近几年,随着ChatGPT火爆,他也成为了AI×数学的旗帜性人物,并且开始更加高频地思考和谈论AI与基础科学交叉的可能性。
而就在2026年刚开年,50岁的陶哲轩更进一步,以联合创始人的身份发起SAIR Foundation,希望这个旨在重塑AI与科学关系的非营利性联盟,能够连接学术界和产业界,并且能够团结和帮助更多的年轻科学家一起推进
两大目标:
一,
用科学的方法打造AI;
二,
借助AI重塑基础科学研究。
△SAIR Foundation主要专家成员
在SAIR Foundation对外官宣后,陶哲轩和Chuck NG——SAIR的两位联创,也在量子位的独家专访中,谈论了他们关于AI x Science、数学、基础科研等等相关的一切。
在他们看来,AI x Science最令人兴奋的地方,在于科研的普惠化。他们希望通过SAIR这座桥梁,能为更多年轻人打开象牙塔的大门。
未来,世界上可能会有10000个陶哲轩。
上面这些只是冰山一角。在这场超90分钟的深度对谈中,你还会看到以下精彩观点:
如果AI在回答时能表达置信度,比如“我比较有把握”或“这里不太确定”,其实际可用性会大幅提升。
学术界和产业界各司其职的模式走不通,速度太慢了,AI时代需要二者紧密合作。
相比金融和医疗,科学是一个更安全的AI试验场,相对而言,算错一道数学题几乎没什么损失。
看似重复、枯燥的基础性工作,对人的成长其实非常重要,青年人需要这些宝贵的训练机会。
大部分学科都在彼此交流,而AI正是促成这种跨学科互动的重要催化剂。
不要简单禁止新技术,高校的任务是教会学生如何正确使用它。
需要解决科研体系的结构性瓶颈,通过跨学科的全球协作,以科学、安全的方式加速通用人工智能(AGI)和超级人工智能(ASI)的演进。
下面附上精校后的完整访谈文字,全文超过
1.5万字
。为了提升可读性,量子位在不改变原意的前提下,对内容做了适当整理和删减。
请享用。
AI X Science需要自己的垂直AI
量子位:
首先,祝贺SAIR Foundation成立。能和我们聊聊发起这个AI X Science机构的动机吗?
陶哲轩:
我认为AI将从根本上改变科研模式,而我们首先要厘清的核心问题是:
如何在科研场景中合理、高效地运用AI?
事实上,我们需要一些高质量的试点项目,来展示什么是最佳实践,让其他科学家可以参考、学习。
过去,这类工作主要由大学、科研机构和政府部门来推动。但在当前环境下,来自其他领域的支持同样非常重要。它更灵活,能有助于我们尝试一些创新性的事。
我很高兴能参与创立这个机构,希望借此探索新想法,尝试更大胆的路径,看看当AI和科学以一种更审慎的方式结合时,究竟能走多远。
Chuck:
我一直都很享受和优秀科学家合作,能和Terry(陶哲轩)一起发起这个组织,我真的非常兴奋。同时还有多位诺贝尔奖和图灵奖得主一起加入。
Terry刚才更多讲了学术侧,而我自己长期推动
学术和产业融合发展
,这也是我们对这个项目格外有热情的原因之一。
如果你看看我们的启动活动,就会发现,参与者汇聚了全球顶尖学术研究者及多家科技领域企业代表,包括NVIDIA、OpenAI、Amazon、Microsoft等,各方围绕AI x Science的发展展开交流探讨,为后续跨领域协作奠定基础。
当学术界和产业界坐在一起,会带来很多机会,可做的事情非常多。
量子位:
从你们的角度看,当下AI技术的主要短板在哪里?为什么科研领域不能直接用OpenAI或其他公司的模型?
陶哲轩:
我们其实已经在尝试使用一些主流LLM,也确实有研究者用它们做出了成果。
问题在于,模型会产生
幻觉
,这对科研来说是个非常严重的问题。科研需要可验证、值得信任的系统。
另一个挑战是
可解释性
。模型有时会给出一个看起来不错的想法,但它往往不会说明这个想法是来自训练数据里的既有文献,还是某种新的组合,也说不清它和已有工作的关系。
科学并不只是解决一个个孤立的问题,更重要的是把新结果放进已有知识体系中,让后来者可以在此基础上继续推进。这就要求结果具备
可追溯性、规范的引用
,以及清楚说明如何扩展或修改。
商业化的大模型有时能做到这些,但并不稳定。如果我们能有专门为科研设计的AI,或者通过更好的工作流去强制验证,并系统性地把结果和文献体系连接起来,对科学的帮助会大得多。
最终很可能的方向,是
把现有模型嵌入到一个更严格的框架中
,配合强有力的验证和校验机制,让它们真正成为科学发现的工具。
Chuck:
事实上,在日常层面,比如写作,AI表现已经不错了。
但一旦进入更深、更专业的技术领域,情况就完全不一样。很多细分科学领域,高质量、结构化的数据本身就非常有限。这也是为什么必须和科学家紧密合作。
我们的目标,是把这些系统打磨到可以可靠地用于科研。最终,我们希望让先进的AI能被绝大部分人使用,也就是
“AI普惠化”
。
陶哲轩:
我举一个非常简单的例子。
科学家在提出一个结论时,通常会同时
说明自己对这个结论的信心程度
,比如“我对此非常有把握”“我有一定把握”“这个想法目前还不太成熟”。
AI并不会这样做,它们几乎总是用一种百分之百确定的语气给出答案。如果AI能够明确表达
不同层级的置信度
,它在科研中的实用性会提升很多。
量子位:
现在整个行业的主线都在谈Scaling,更多数据、更大的模型、更强的算力。但SAIR更关心
“Scaling the Science of AI”
,这具体指什么?
陶哲轩:
目前为止,科技公司所采用的路线确实非常成功。当算力和训练数据提升一个数量级时,模型能力会有明显跃升。这套方法到现在为止效果还都比较好。
但
从长远看,它会撞墙
。数据不是无限的,公开互联网基本已经被用得差不多了,同时还存在能源和算力等方面的约束。
另外,现在的AI能解决非常困难的问题,
但往往很低效
。一个人类数学家,可能看十个例子就能抓住问题的核心,然后举一反三;而现有的AI,往往需要数百万个训练样本,还要反复尝试,甚至运行上百次,才能得到一个正确结果。
放到科研中看,我们并不总是需要
最大、最通用的模型
。很多科研任务本身非常专门化。在一些场景下,体量更小、功耗更低、成本更低的模型,甚至能直接在个人电脑上运行,就已经足够用了。
大型公司更关注打造“什么都能做”的通用模型;而科研场景,可能更需要
为特定工作流量身定制的专用工具
。开发和支持这类工具,正是我们希望通过SAIR去推动的一件事。
量子位:
我能不能这样理解,在AI x Science这个方向上,真正关键的,是更好的原则和方法论,而不是一味把模型做得更大?
陶哲轩:
可以这么理解。我们需要更好的方式去评估可信度、表达置信水平,也需要提升系统的可解释性。
我们同样需要改进人类与AI协作的方式。现在最常见的交互模式,是你给模型一个提示,它直接给出一个完整答案。
但在很多科研场景中,研究者往往不只关心最终结论,
还希望看到推理过程本身
。你可能想在中途介入,补充新的信息,或者探索不同的路径。
目前不少研究者对AI的应用仍持观望态度,一方面是因亲身经历过系统出错的情况,另一方面是现有工具与他们的核心研究需求不匹配。
如果科学家能够开发真正贴合自身工作流和研究需求的工具,我相信这些系统的使用率会显著提高。
Chuck:
我想从另一个和可信度相关的角度补充一下,“数据质量”。
我们的一位密切合作伙伴,
John Hennessy
,一直在为SAIR Foundation提供建议。他是图灵奖得主,同时也是Alphabet的董事长。他经常强调,在科研中,提升数据质量的重要性不亚于提升模型本身。
信任本身也是一个更宏观的社会问题。在不同地区,人们对数据和技术的信任程度并不一样。美国社会对一个东西的信任水平大概在
70%到80%
,而对AIGC的信任度,
往往只有这个数字的一半
左右。
这种落差,也解释了为什么很多组织,包括OpenAI、xAI以及其他AI公司,都希望与我们合作。信任、可靠性和科学严谨性至关重要。
量子位:
随着AI不断降低科研门槛,会给整个行业,以及全球科研格局带来哪些变化?
Chuck:
这个问题很好。我觉得最终的目标,是在和顶尖科学家、研究者一起合作的过程中,把AI提升到一个“
默认值得信任”
的水平。
一旦AI达到这样的程度,它就不会只被专家使用。普通人也能放心用,比如你的父母,甚至爷爷奶奶,都可以
在日常生活中依赖AI
,而不用担心它靠不靠谱。
这也正是我们为什么要把一流的科学家和产业界的伙伴聚到一起,彼此学习、共同推进。只有通过这样的协作,技术本身以及它在真实科研场景中的应用,才能一起向前走。
我们希望AI能成为一种日常工具,
就像汽车一样
。当AI达到这样的可靠性水平时,全球科研格局才会真正发生变化。
量子位:
SAIR具体会如何参与并推动这一转变?
Chuck:
我们的做法,是把学术界和产业界以一种更直接、更有组织的方式拉到一起。
在学术侧,很多研究者缺乏算力,也很难获得长期、稳定的资金支持;在产业侧,公司拥有算力、资本和工程能力,但现有模型和工具和科研需求之间还有明显错位。
科研领域越来越
需要更广泛的社会力量参与进来
,包括捐助者、基金会、投资人和创业者。把这些人聚在一起,能更好地支持那些真正长期、具有高影响力的研究方向。
我们相信,这种协作模式能把科学的边界推得更远。
陶哲轩:
在过去几十年里,一个主流模式是:
学术界主要依赖官方资金支持,产业界则负责把研究成果转化为应用。
学术研究者提出基础性的想法,产业界或其他主体再把这些想法变成知识产权、专利和商业产品。
这条链路能运转,但速度相对较慢。在一些国家里,学术界并没有动力去考虑市场化问题,而产业界也很少投入到真正长期、基础性的研究,更关注短期回报。
我们可以重新思考,在21世纪,从基础科学到应用研究,再到现实世界产品的这条路径应该如何设计,怎样才能更高效,也更贴合社会需求。
Chuck:
这是一个非常特殊的历史节点。过去,大学和科研机构可以依赖相对稳定的政府资助;现在,尤其是在美国,
这种支持出现了变化
,新的合作模式变得非常必要。
我们把这看作一个机会,各方都在探索新的资源整合模式,像SAIR这样的组织也站出来了,支持杰出的研究者,并与产业伙伴紧密合作。
量子位:
AI模型的质量在很大程度上取决于数据。你们觉得,在不同基础科学领域里,数据的多少是否会导致AI落地难度的差异?
陶哲轩:
AI在那些
高质量数据
比较充足的科学领域里,进展往往最快。
一个很典型的例子就是
蛋白质折叠
。这个领域经过了几十年持续投入,积累了大量经过精心整理的高质量蛋白质数据。
但在其他领域,情况就完全不一样了。比如对单个细胞进行建模,乍一看好像是相近的问题,但我们目前并没有同等质量、同等规模的数据。
AI对数据的依赖程度非常高,远超许多传统科学方法,这是一个真实存在的瓶颈。
有人寄希望于用
合成数据
来替代真实数据,但如果生成方式不够严谨、标准不够高,可能适得其反。低质量的合成数据会污染原有数据集。
Chuck:
我完全同意,而且我也觉得,不同学科之间的难度差异非常大。
如果想在这些领域解决更难的问题,强大的基础模型当然很重要。但正如Terry说的,没有高质量数据,再复杂的模型也会举步维艰。
有一句老话叫
“garbage in, garbage out”
,在这里体现得非常明显。这也是为什么AI x Science这样的项目如此重要。
在2月10日的活动中,我们把来自不同学科、不同机构的一些顶尖学者聚到了一起。参与者包括来自UCLA、Berkeley、Caltech,以及美国和北美各地高校的研究者。
我们的主旨演讲嘉宾中,还有一位最近获得图灵奖、同时也是强化学习领域的奠基者之一,
理查德·萨顿
。
我们也在促进
跨地区研究者交流
。推动AI x Science,离不开全球范围内的共同参与。
量子位:
SAIR具体如何支持科学家之间的跨学科、跨国家合作?
Chuck:IPAM
(Institute for Pure and Applied Mathematics)和UCLA其实已经在这方面做了很多年,而且做得非常好。IPAM长期以来都有组织跨学科主题项目和工作坊的传统,时间跨度往往很长,参与领域也很广。
我前段时间去新加坡和马来西亚,其实就是参加了一个由
OpenMind
组织的冬季学术营。OpenMind的创办者也就是图灵奖得主理查德·萨顿,该组织主要面向来自世界各地的年轻研究者。
那次活动的参与者很多都来自亚洲,包括新加坡、马来西亚、中国、菲律宾、韩国等地。大家聚在一起,交流想法,讨论更高效的模型,一起思考AI接下来应该往哪里走。
这种跨地区、跨学科的合作框架,和SAIR希望支持的方向高度一致。
陶哲轩:
SAIR今年才刚刚起步,但IPAM已经运作了二十多年。
IPAM最有代表性的活动之一,是为期大约三个月的长期主题项目。在这些项目中,我们会邀请来自不同领域的学生、教师,有时也包括产业界的研究者,围绕一个主题深入交流,比如心脏相关科学,或者自动驾驶。
事实上,我们在深度学习真正大规模兴起之前,就已经办过相关的研讨会。
虽然IPAM并不是一个专门做AI的机构,但它举办了很多在AI相关方向上具有影响力的活动。核心理念,就是把那些平时很少有机会交流的群体聚到一起,比如纯数学家、应用数学家、物理学家、工程师,以及其他科学家。
过去,这种合作更多集中在学术内部。通过SAIR,我们希望把这个模式再往前推进一步,
加强与产业界的连接
,同时更关注一些中短期内能够产生实际影响的应用。
我自己的背景仍然主要在数学,但现在我们也在更广义地理解数学,把它放进一个连接理论、计算和现实影响的生态中。
我们希望尝试新的形式,探索更多把不同社群聚在一起的可能性。
Chuck:
IPAM和UCLA花了几十年时间,打下了坚实的协作基础,而通过SAIR,我们可以把这套模式在地域上、在学术与产业之间进一步扩展
SAIR的核心目标,是基于已经行之有效的基础,把它扩展成一个真正
全球化、跨学科
,并且紧密连接真实科学问题的合作网络。
量子位:
AI for Science的发展,会不会反过来影响今天产业界开发和使用AI的方式?它有没有可能成为一条通向AGI的更优路径?
陶哲轩:
我觉得这是一个非常有前景的方向。
在数学和科学中,尤其是在数学里,很多输出是可以被
形式化验证
的,这给了我们一种约束AI的方式。把AI放进一个可以验证的环境中,这有助于减少幻觉。
如果我们能在数学或科学中,建立起可靠、可验证的AI框架,这些原则是有可能推广到其他领域的。
现在在医学、金融等领域,完全信任AI
依然风险很高
。你可以把它当作辅助工具,但在涉及生命安全或巨额资金时,很难放心地把控制权交给AI。
如果我们能先在科学领域解决可靠性和验证的问题,之后这些成果就有机会
迁移到更广泛的应用
中。
Chuck:
以金融为例,大多数人并不会愿意把敏感的金融决策完全交给AI;医学也是一样,错误可能直接关系到生死。
正因为如此,AI for Science,以及反过来的Science for AI,才显得尤为重要。
如果我们能在科学环境中打造出真正值得信任的AI系统,我们希望这些进展可以在不久的将来,迁移到那些关键性应用场景中。
陶哲轩:
没错。数学和科学为AI提供了一个非常安全的试验场。
如果AI在医疗或金融场景中出错,后果可能非常严重;但如果它算错了一道数学题,最多就是再试一次,
几乎没有损失
。
这让数学成为一个理想的环境,用来打磨可靠AI的系统。
Chuck:
还有一个优势在于,数学研究通常不需要像其他应用那样消耗巨大的算力。这让我们可以更高效地反复实验,用相对较低的成本探索新思路。
陶哲轩:
这也是为什么从这里起步。药物研发当然非常重要,但临床试验的成本极高、周期又很长,为了验证一种AI方法就投入数十亿美元是很难实现的。
相比之下,在数学中开发和测试AI,
可以更快、更安全地验证想法
,再逐步走向那些高风险、高投入的领域。
量子位:
有一种担忧是,更高层次的研究能力,比如
“品味”
,本应建立在扎实的基础训练之上,但AI可能正在拆掉这些年轻研究者的成长阶梯。你们怎么看?
陶哲轩:
现在,AI已经能完成很多过去属于研究生或初级研究者训练内容的工作,比如解一些标准问题、做实验中的部分环节、或者整理文献。
这些事情越来越容易被自动化,于是会产生一种诱惑:
既然AI更快,那干脆全部让AI来做。
但问题在于,这些看起来重复、甚至有点枯燥的训练,对人的成长非常重要。我自己,包括很多资深研究者的能力,很大一部分就来自这些初级工作。
所以必须有一个平衡。即便AI能做,我们也要有意识地为年轻研究者保留有价值的训练过程。等一个人积累了足够的经验,比如亲手做过一定数量的实验之后,再逐步引入自动化。
Chuck:
现在已经能看到一些过度依赖的趋势。大家都知道AI并不能百分之百可信,但很多人还是会第一时间把问题丢给AI,直接要答案或建议,这其实会削弱独立思考的能力。
这也是为什么我们特别强调让顶尖科学家参与进来。像Terry这样的研究者,或者其他诺奖级别的科学家,都是
在没有AI工具的时代接受过严格训练
的人。
通过建立一种类似
“师徒制”
的结构,让经验丰富的研究者与有潜力的年轻人紧密合作,能逐步形成更好的实践方式、更好的模型,也包括更好的平台,在支持创新的同时,不牺牲学习本身。
陶哲轩:
这里其实也有一个很有意思的历史类比。
计算器
刚出现的时候,很多人担心学生会不会从此不学基本的算术了。
这种担忧在某种程度上确实有道理,所以直到今天,我们仍然会先教孩子手算加减乘除,再让他们用计算器。
但另一方面,计算器也极大地拓展了人们探索的空间。它让人更容易去试验数字、发现规律、探索原本很难触及的想法。
工具本身并不会自动让人变弱
,它同样可以激发探索和创造力。关键在于如何使用。
面对AI,我们也需要做出类似的判断:
什么时候该用,什么时候该克制
,以及如何把它引入训练体系,同时不削弱那些真正重要的核心能力。
量子位:
随着AI逐步替代很多现有的科研流程和技能,未来研究者最重要的能力和特质会是什么?
陶哲轩:
未来的科研会越来越多地以更大规模、更多元化的团队形式展开。团队里可能既有学术研究者、产业研究人员、数学家和科学家,也会有AI系统和不同背景的人一起协作。
在这种情况下,如何在大型团队中高效合作,会变成一项非常重要的能力。
过去,人们常把科学描绘成“孤独天才”的事业,但现实里它早就是团队合作,而且这种趋势只会继续加强。
沟通能力,以及我们常说的那些软技能,会变得越来越重要。
在这个背景下,
“品味”很关键
。能够形成整体判断,识别哪些方向值得投入,再借助AI工具或其他合作者把想法展开,这种能力非常重要。
我们很可能会看到
比过去更细致的分工。
传统上,尤其是在数学领域,工作方式几百年几乎没怎么变,有时甚至带点“中世纪风格”。一个人要同时负责检查细节、做计算、发展想法、写论文、申请经费、再去做报告。
但在未来,大型项目会由很多人共同完成。有人负责长期愿景,有人擅长和AI工具深度协作,有人负责团队协调,有人负责将其讲给更多人听。
能为数学和科学做出贡献的
能力类型
,会变得丰富得多。
Chuck:
我经常半开玩笑地说自己是个
“立志当科学家的人”
,很大程度上是因为我有机会和像Terry这样的杰出科学家、数学家长期合作。
我的背景并不在科研,而更多在商业领域。但我听过一些非常成功、打造过数十亿美元公司的人说过,他们见过
最优秀的一些prompt工程师,背景并不是工程或计算机,而是会计、法律。
这恰恰说明,未来的科研会变得更加开放。借助AI和新的工具,来自完全不同背景的人,都有机会以有意义的方式参与科研。这也是我们所说的“科学和AI普惠化”的重要内涵之一。
陶哲轩:
我现在参与的很多项目,以及SAIR希望支持的方向,本身就已经是高度协作的。它们往往汇集了职业数学家、学生、其他学科的研究者,有时甚至还包括
公众参与者
。
随着AI和相关工具的发展,从事严肃科学和数学研究的门槛正在降低。这是这次技术变革中,最令人兴奋的一点。
量子位:
那是不是意味着,未来连我还在读初中的弟弟,都有可能在《Nature》上发论文?
陶哲轩:
这是有可能的(笑)。
未来可能会有论文拥有成千上万名作者
,每个人都贡献其中一小块,但都是真实、有价值的贡献。从这个意义上说,很年轻的人参与其中,并不是不可能。
事实上,在数学领域已经出现过这样的例子:有青少年在AI的帮助下,给某个已知问题找到了新的解法。它未必是最重大的突破,但确实是新的结果。
这种情况将来会变得多普遍,但现在还不好说,唯一的办法就是继续尝试、不断探索不同的研究方式。
Chuck:
我其实非常希望能看到那样的场景。在过去,如果你没有很强的STEM或工程背景,几乎不可能直接参与前沿科研。
如果来自非传统背景的人,也能以有意义的方式参与科研,并真正对世界产生积极影响,那将是一件非常了不起的事情。
量子位:
结合我们前面的讨论,你们能不能举一些更具体的例子,说说SAIR未来会如何支持青年研究者的成长?
Chuck:
这是个特别好的问题,说实话,这也是我个人非常投入的一件事。我很多年来一直在做和导师制相关的工作,从大学阶段就开始了。
从我的观察来看,
培养年轻研究者,最重要的一点是树立榜样。
人在不同阶段,都会寻找榜样。
小时候,在家里看父母;进了学校,看老师;再往后,就会把目光投向更广阔的社会。
这也是为什么我们如此重视把不同领域的杰出科学家聚在一起。每一位创始成员,成功的路径都很不一样。
Barry Barish
的科研经历非常有代表性。爱因斯坦在早期论文中就预测了引力波的存在,但从提出这个理论,到实验上真正观测到
引力波
,中间走了
将近一百年
。
但直到2016年前后,人类才首次探测到引力波,Barry Barish也因此在2017年获得诺贝尔奖,目前Barry Barish也是SAIR顾问委员会创始成员。
这个例子很好地诠释了什么叫几十年如一日。
这些杰出科学家的价值,不只在于他们的成果,也在于他们能够分享自己在不确定性、挫折和失败中是如何坚持下来的。这是导师制中非常重要的一部分。
年轻科学家并不缺天赋,只是刚刚起步。所以我才会如此重视和Terry、以及整个创始团队一起做这件事,因为现在最需要支持的,恰恰就是这些年轻人。
Terry是独一无二的,但如果借助AI和更好的培养渠道,
未来能不能不只有一个陶哲轩,而是10000个陶哲轩?
这难道不是件非常令人兴奋的事吗?!
陶哲轩:
是的。SAIR只是众多尝试中的一种,它不可能包揽所有事情。支持下一代研究者的需求非常广泛,没有任何一个组织能独立完成培养整个科研队伍的任务。SAIR能做的,是专注于少数有针对性的项目。
以IPAM为例,我们可以支持
暑期学校、研讨班
,以及面向公众的
科普和交流活动
。一些协作式、众包式的研究项目,本身就会自然地吸引年轻研究者参与,有些情况下,他们甚至可以承担领导角色
本文来源:量子位