10 天 3000 元,一人造出全球 AI 爆款!好莱坞导演抢人、游戏版引爆期待,合作细节首次披露
点击查看原文>
一位中国 29 岁、中专毕业的 AI 视频创作者,直接让一个自称“病毒式 AI 广告狂人”的海外 CEO,全网寻找、隔空发 offer。

近日,AI 原创短片《丧尸清道夫》在海内外社交平台持续发酵。这部“国产爱死机”短片,不仅在 B 站播放量超过 210 万、抖音播放量超过 348 万,在海外 AI 视频圈引发热烈讨论。更引人关注的是,AI 原生创意工作室 Genre.ai 创始人兼 CEO PJ Ace 公开发帖称,《丧尸清道夫》是他“近年来看过最好的短片之一”,并隔空向作者 Mx-Shell 抛出合作橄榄枝。

PJ Ace 是近一年海外 AI 广告圈颇具代表性的人物。他在个人简介中自称“Viral AI ad madman”,即“病毒式 AI 广告狂人”。其 AI 视频内容累计观看量已超过 3 亿次,并曾被 Variety、The Hollywood Reporter 等媒体关注。作为 Genre.ai 的创始人兼 CEO,他主打用生成式 AI 制作短片、广告和品牌传播内容。
与许多单纯展示 AI 视频技术能力的创作者不同,PJ Ace 更像是 AI 时代的广告导演与增长操盘手。公开资料显示,他此前有商业导演背景,曾服务过 Toyota、Red Bull 等品牌。进入 AI 视频领域后,他将传统广告中的脚本、分镜、剪辑和传播经验,迁移到 Runway、Veo、Kling、Seedance 等生成式视频工具之上,用更低成本、更快速度批量生产高冲击力内容。
当然,PJ Ace 本人也颇具争议。他的作品风格往往夸张、荒诞、猎奇,有人认为这是 AI 广告的新范式,也有人批评其为“AI slop”。
《丧尸清道夫》显然击中了这个标准。
这部短片以末日废土、丧尸、机器人清道夫等强类型元素为核心,视觉风格成熟,没有 AI 味儿,完成度远超许多人的想象。根据片尾介绍,该作品综合使用了 SeeDance 2.0、GPT Image 2、Nano Banana Pro、Midjourney、Flux Max 2 等工具制作完成,据报道,其中 80%到 90%的部分,由小云雀 Seedance 2.0 的“沉浸式短片”模式完成。
更具戏剧性的是,当有网友在 B 站评论区转达 PJ Ace 隔空递 offer 的消息时,作者 Mx-Shell 随口回复了声“看不懂英文”,随后不少网友赶紧提醒他“恶补”,到了海外这句话也成了一句段子。一个海外 CEO 跨平台寻找中国创作者,而创作者因为语言壁垒差点错过合作信号,这也成为《丧尸清道夫》出圈故事的一部分。

据报道,Mx-Shell 原名刘梓瑜,目前生活在云南。另外,据“wuhu 动画人空间”报道,他真正的职业其实是房地产公司的宣传部门,负责平台运营、宣发物料。《丧尸清道夫》整部片子由他一个人独立完成,前后花费约 10 天,Token 成本折算人民币约 3000 元。更有意思的是,他在评论区回复网友时表示:“我甚至没掏钱,全靠平台扶持。”
《丧尸清道夫》爆火之后,Mx-Shell 的抖音社群迅速满员。据了解,他在直播和社群中分享了不少视频提示词和制作心得,吸引了大量 AI 视频创作者围观学习,还有社区的伙伴用 300 元成本复刻了一段相似的视频。

面对 PJ Ace 抛来的橄榄枝,Mx-Shell 表示感谢,在采访中透露双方通过邮件沟通过,最后他决定先把重心放回生活和创作本身,一是家人和生活都在国内,二是想静下来,继续学习。
“我真是在互联网时代见证了一个又一个人崛起走向巅峰。”有网友在其评论区说道。《丧尸清道夫》的爆火,至少证明了:在 AI 加持下,个人创作者的野生想象力更容易实现,并且跨过平台、语言和地域壁垒,被全世界的人看到,普通人也可以凭借才华去颠覆影视和游戏行业。
目前,《丧尸清道夫》的商业化已经启动。
据 Mx-Shell 透露,这部短片已和影视公司达成合作,大银幕版本即将面世。此外,Mx-Shell 已成为 AI 互动视频游戏平台 Yoroll 的合作创作者,基于《丧尸清道夫》世界观改编的 AI 互动视频游戏已进入制作阶段,数千网友留下了期待的评论和关于游戏版的各种问题。

据悉,Yoroll 是一个面向 AI 原生游戏和互动视频的创作平台,它把世界模型、视频生成、分支叙事和游戏玩法组件整合到一套工作流里,让创作者可以用更低门槛制作可观看、可互动、可发布的作品。此前,有一位零游戏经验用户用 Yoroll 在一周的时间里做了款《华君传》游戏,目前抖音百万播放量。
Yoroll 是 LinearGame 旗下平台,《完蛋!我被美女包围了》主创成员和好莱坞顶级动画工作室和全球知名互动叙事游戏公司深耕近二十年的获奖创意总监纷纷加入了团队。
我们联系采访了 AI 原生互动视频游戏平台 Yoroll.ai 的创始人 Heath,他透露了《丧尸清道夫》游戏化后的一些情节玩法,并为我们详细介绍了 AI 视频游戏赛道的玩法,包括技术实现、商业化情况等。
Heath 指出,当下世界模型暂无法支撑高确定性开放世界,世界模型做视觉表现,传统游戏逻辑定规则,视频 + 游戏逻辑是现阶段最易落地、规模化的最优形态。越依赖复杂工程和长线运营的游戏品类,护城河越持久;越依赖内容生产和叙事表达的品类,被 AI 改造得越快。
下面是详细对话。
“互动视频”不是世界模型的妥协
InfoQ:之前有预料到《丧尸清道夫》会这么爆火吗?抖音上好多人在问 Yoroll 的介绍和游戏的计划进度,还上了热搜,你们如何看待?
Heath:没有完全预料到这个传播规模。我们一开始判断《丧尸清道夫》有爆款潜力,因为机器人牛仔、末日废土、丧尸清道夫这些元素很强,几秒钟就能让用户理解和记住,画面质量和镜头调度都很强;但它能从国内平台一路传到海外 X,让游戏也登上抖音热榜,确实超出了预期。
我们更看重的是它背后的信号:AI 正在让非传统科班创作者做出过去只有专业团队才能完成的内容。Yoroll 和 MX-Shell 的合作,不是简单追热点,而是想验证一条新路径:AI 短片先在社交平台验证审美和传播,再被改造成可互动、可复玩、可运营的 AI 视频游戏 IP。
《丧尸清道夫》游戏版会基于原短片世界观继续扩展,加入分支剧情、玩家选择和射击玩法,让用户不只是观看这个废土世界,而是真的进入其中。

InfoQ:游戏行业过去有两条典型成功路径:一条是腾讯式的渠道、流量和运营,另一条是米哈游式的精品化、工业化和全球 IP。您认为这两条路为什么越来越难?
Heath:这两条路径本质上都需要非常重的资源积累。
腾讯式路径背后是渠道、流量、社交关系链、发行体系和长线运营能力。它不是单点产品能力,而是一个庞大的生态能力。普通开发者即便有一个很好的创意,也很难获得同样的分发效率和用户触达能力。
米哈游式路径则代表另一种极致:精品化、工业化、全球化和 IP 长线运营。它要求团队在美术、技术、剧情、音乐、发行、社区运营上都达到非常高的水准,同时还要承担巨大的研发周期和资金风险。
这两条路当然很强大,但它对中小团队来说越来越像一条难以负担的“重工业路线”。
所以我们看到的问题是,游戏行业并不缺创意,但创意很难穿过工业化生产和流量分发的双重门槛。生成式 AI 和世界模型的价值,恰恰在于可能提供第三条路:让创作者绕开一部分传统重资产流程,用更轻的方式做出有沉浸感、有互动、有传播力的游戏体验。
InfoQ:Genie 3 联合负责人曾提到,其实并不完全确定世界模型最终会落到哪些应用场景,但互动媒体和互动体验方向目前比较明确。你们之前在场景上做过哪些探索、踩过哪些坑?为什么最后聚焦到“世界模型 + 互动视频”这条路线上?
Heath:目前世界模型的主要应用场景有两个大的方向:具身智能和互动娱乐。
我们一开始也看过很多方向,包括 AI NPC、Vibe Coding 小游戏、AI 短剧、UGC 游戏工具、3D 世界生成等。
踩过的最大坑是:如果一开始就想做完整开放世界,很容易把问题做得过大。开放世界需要稳定空间、连续物理、复杂任务、长期记忆、战斗系统、经济系统和大量测试。今天的世界模型在表现力上已经很强,但在确定性、可控性、长时间一致性和低延迟上还没有完全成熟。
后来我们意识到,世界模型最先落地的场景,不一定是完整替代传统游戏,而是先从“互动媒体”开始。互动视频正好处在影视和游戏之间:它有电影级画面,有剧情和角色,也有玩家选择、状态变化和轻量玩法。
所以我们选择“世界模型 + 互动视频”,不是因为它是一个小方向,而是因为它是当前技术条件下最现实、最容易规模化、也最能体现 AI 原生能力的第一形态。
InfoQ:世界模型进入游戏行业,真正带来的变化是降低开发成本,还是让开发者有机会绕开传统大厂路线,进入一条新的生产路径?您认为真正的创新发生在技术、玩法、内容,还是生产方式上?
Heath:我认为真正的变化不是简单降本,而是生产方式的变化。
如果只是把 AI 当作外包美术、外包编剧,那它是能能降低成本,但这还不是最本质的变化。更重要的是,世界模型让游戏的生成逻辑发生变化:过去是先生产资产,再把资产放进引擎里运行;未来可能是先定义世界、角色、规则和交互,再由模型实时或半实时生成对应的视觉表现。
也就是说,AI 不只是帮原来的游戏工业流程提效,而是在创造一种新的游戏生产范式。
真正的创新会同时发生在四个层面:技术上,视频和世界模型成为新的表现层;玩法上,玩家可以和动态生成的内容互动;内容上,一个 IP 可以生成大量个性化版本;生产方式上,创作者从“手工制作资产”变成“编排世界、剧情和规则”。
我们最看重的是最后一点:生产方式被改变。因为一旦生产方式变了,谁能做游戏、什么内容能成为游戏、游戏如何分发和变现,都会跟着改变。
InfoQ:为什么是“互动视频”,而不是一开始就做传统意义上的“互动游戏”或“开放世界游戏”?这是否说明当前世界模型更适合先服务轻量互动内容,而不是复杂游戏系统?
Heath:是的,至少在当前阶段,世界模型更适合先服务互动视频、互动叙事和轻量游戏系统。
传统开放世界游戏对确定性要求极高。玩家每一个操作都要有稳定和迅速的反馈,世界状态要长期一致,物理规则不能随机变化,任务系统不能发散失控。这些对当前世界模型来说仍然是挑战。
互动视频的优势是,它可以把模型最强的能力先发挥出来:生成画面、角色、镜头、情绪、对白和场景变化。同时,我们可以用传统游戏逻辑去约束它,比如分支图、状态机、任务条件、角色关系和数值系统。
所以互动视频不是妥协,而是一个很好的中间形态。它既不是纯视频,也不是传统游戏,而是“视频作为表现层,游戏系统作为逻辑层”的新形态。
从这个方向往后演进,才有机会逐步走向更高自由度的 AI 原生游戏。
InfoQ:《完蛋!我被美女包围了》核心主创加入后,是否意味着你们更看好真人互动、恋爱模拟和短剧式游戏?你们想做的体验和《暴雨》《底特律:变人》等经典互动叙事游戏相比,最大的区别是什么?
Heath:我们确实看好真人互动、恋爱模拟和短剧式游戏,因为这些品类已经证明了用户对“剧情 + 选择 + 情绪反馈”的需求。但我们并不只把自己定位在恋爱模拟或者真人互动影游。
《完蛋!我被美女包围了》这样的作品证明了一件事:互动叙事并不是小众需求。只要人物关系足够强、情绪反馈足够直接、选择足够有代入感,用户是愿意为这种体验付费和传播的。
但我们想做的东西和《暴雨》《底特律:变人》这类经典互动叙事游戏有一个根本区别:它们仍然是重工业内容,一切分支、表演、镜头和资产都需要提前制作。我们的目标是用 AI 把这种生产方式变轻。MX-Shell 目前做出来的内容,从视觉质量上已经超越了这些经典游戏,但是制作成本和难度低了不止一个数量级。
未来,一个互动叙事游戏不一定要拍摄几百小时素材,也不一定要为每条分支都提前制作完整资产。创作者可以用 AI 生成角色、场景、对白和视频片段,再通过系统控制分支和状态。
所以我们的目标不是复制传统互动影游,而是让更多创作者有能力做出接近互动影游体验的 AI 原生内容。
InfoQ:如果 AI 互动游戏主要依赖视频生成、剧情分支和轻交互,它和传统互动影游、视觉小说、短剧之间的边界在哪里?判断它是“游戏”还是“互动视频”的核心标准是什么?
Heath:我觉得核心标准不是画面形式,而是有没有“系统性反馈”。
如果用户只是点击不同选项,播放不同视频,它更接近互动视频或互动短剧。
如果玩家的行为会改变状态,比如角色关系、任务进度、道具、数值、结局路径、后续剧情生成,那它就更接近游戏。
所以判断它是不是游戏,关键看三点:
第一,玩家行为是否改变系统状态。
第二,系统是否根据状态持续反馈。
第三,玩家是否能通过选择、操作和策略影响结果。
AI 互动游戏可以采用视频作为画面,但底层必须有游戏逻辑。视频只是表现形式,状态、规则和反馈循环才是游戏的核心。
如何处理概率模型和游戏确定性间的矛盾
InfoQ:Genie 3 这类世界模型在长时间一致性上仍有局限,但游戏必须具备确定性、可复现性、物理规则稳定和交互逻辑一致。您怎么看世界模型的概率生成能力和游戏系统确定性之间的矛盾?当前研究层面有哪些解决路径?
Heath:这确实是 AI 游戏最核心的矛盾之一。
世界模型本质上是概率生成系统,它擅长生成丰富、自然、多样的画面和行为,但游戏需要确定性。玩家击中就是击中,失败就是失败,某个道具拿到了就是拿到了,角色关系变化也必须被记录下来。
我们的看法是,不能把游戏的确定性交给模型本身。模型应该负责“表现”,系统负责“规则”。
目前比较可行的路径有几类:一是把世界状态外置,用状态机、剧情图、数据库和任务系统管理关键状态;二是把模型生成限制在明确边界内,通过 Prompt、参考图、视频骨架、控制信号等方式约束输出;三是用 VLM 或 Observer 模块对生成结果进行判定和校验;四是把高风险、高精度玩法交给传统游戏逻辑处理,而不是完全交给生成模型。
也就是说,AI 生成世界,但游戏系统裁决世界。这个分工非常重要。
InfoQ:实时生成剧情如何避免无限发散,最后无法收束?角色记忆是依赖长期记忆数据库、剧情状态表,还是模型上下文?玩家改变一个剧情分支后,系统如何记录并延续这些状态?
Heath:我们不会让模型无限自由发挥。AI 互动游戏必须是“有限边界里的无限变化”。
具体来说,我们会有几个层次的约束。
第一是剧情图。主线结构、章节目标、关键事件和结局边界是预先设计好的,模型不能随意破坏。
第二是状态表。玩家做过什么选择、触发过什么事件、角色关系如何变化,都会被结构化记录。
第三是长期记忆。玩家偏好、历史行为、角色互动记录会影响后续对白和表现。
第四是模型上下文。它负责当前场景内的生成,但不承担全部长期记忆。
玩家改变一个剧情分支后,系统会把这个分支转化成结构化状态,比如“角色 A 被救下”“玩家选择背叛阵营 B”“某个道具已获得”。后续生成剧情时,模型会读取这些状态,再生成符合当前世界状态的对白、镜头和剧情表现。
所以,角色记忆不是只依赖模型上下文,而是长期记忆、状态表、剧情图和上下文共同作用。
InfoQ:射击、解谜、卡牌、QTE 等玩法组件,是预设模板,还是由 AI 动态生成规则?如果 AI 生成玩法,如何测试它真的可通关、不卡死、不自相矛盾?
Heath:短期内,我们更倾向于“预设组件 + AI 生成内容 + 人工可视化调优”。
完全让 AI 动态生成玩法规则,风险非常高。它可能生成一个看起来合理但实际上不可通关的谜题,也可能生成一套不平衡的卡牌规则,或者在某些分支里把自己卡死。
所以我们会把常见玩法抽象成组件,例如 QTE、射击、找线索、卡牌、点击、滑动、解谜等。底层规则是确定的、可测试的、可复用的。AI 负责生成关卡包装、剧情动机、线索文本、参数建议和视觉表现。
创作者可以在编辑器里调整这些组件,比如命中区域、倒计时、难度、失败反馈、奖励和剧情影响。这样既能降低创作门槛,又能保证游戏可控。
长期看,AI 可以参与生成玩法,但必须经过自动测试、路径验证、状态校验和人工审核,不能直接上线一个未经验证的规则系统。
InfoQ:实时生成 3D 空间和视频内容,对推理延迟和算力成本要求很高。你们如何控制等待时间?哪些内容实时生成,哪些内容预生成或缓存?平台如何平衡生成质量、交互延迟和推理成本?
Heath:我们不会把所有内容都实时生成。比较现实的方式是“预生成 + 缓存 + 局部实时生成”。
核心剧情、关键镜头、主要角色出场、重要分支,可以提前生成和缓存。玩家真正需要即时反馈的部分,比如短对白、表情变化、镜头衔接、局部场景变化、个性化细节,可以做近实时生成。
这和传统游戏里“主资源预加载,局部动态渲染”的思路有点类似。只不过我们的资源不是 3D 模型和贴图,而是视频片段、角色资产、Prompt 模板和状态驱动的生成结果。
平衡质量、延迟和成本,关键在于分层:
高质量长视频不一定实时;
关键互动反馈必须及时;
个性化内容只在真正影响体验的地方生成。
玩家最敏感的是反馈是否顺畅,而不是每一帧是否都完全实时生成。我们会优先保证交互节奏,再逐步提升实时生成比例。
InfoQ:AI 降低创作门槛后,行业会迎来内容繁荣,还是低质内容泛滥?你们如何避免 AI 互动内容变成低质剧情、套路模板和“AI 垃圾内容”的堆积?
Heath:我们认为,AI 不会自动带来好内容,它只会放大创作能力。没有审美、没有结构、没有用户理解的人,用 AI 也很容易生成低质内容;但有想法、有叙事能力、有用户洞察的创作者,会因为 AI 获得过去没有的生产力。
所以平台的责任,是建立一个高质量创作生态。
Yoroll 要做的不是“让大家随便生成一堆互动视频”,而是把好的叙事方法、互动结构、游戏组件和商业化机制产品化。创作者可以快速开始,但平台要帮助他们打磨、测试、分发和变现。
从长期看,AI 会让内容供给极大丰富,但真正形成商业价值的,仍然是那些有角色、有情绪、有互动、有系统反馈、有复玩价值的作品。
我们相信未来会出现大量“可玩的互动世界”,但平台要做的,是让这些世界不是一次性的 AI 内容,而是可以被持续运营、持续二创、持续商业化的 IP。
AI 转移了游戏开发的工程重点
InfoQ:你们现在的游戏制作流程和传统开发流程相比,最大的差异是什么?AI 具体增强了哪些环节?同时是否带来新的问题,比如技术债、不可控性、调试困难和内容一致性风险?
Heath:最大的差异是,传统游戏流程是资产驱动,我们的流程是生成和编排驱动。
传统流程通常是:剧本、美术概念、建模、绑定、动画、关卡、程序、测试、发行。每一步都很重,而且很多内容一旦做错,返工成本很高。
我们的流程更像是:世界观设定、角色设定、剧情节点、分支逻辑、视频生成、玩法组件配置、状态测试和发布。AI 会增强剧本扩写、角色设计、分镜、视频生成、对白、配音、局部玩法内容和多版本内容生成。
但 AI 也带来新问题。比如生成内容不可控、角色一致性风险、剧情可能发散、调试不像传统代码那样明确、不同模型输出不稳定、内容审核成本增加。
所以,AI 游戏不是把游戏开发变简单到没有工程,而是把工程重点转移了。过去难点在资产生产,未来难点在生成工作流、状态管理、自动测试、内容一致性和质量控制。
InfoQ:你们主打“人人都能做游戏”。如果没有开发经验的普通人一周内就能做出 AI 互动游戏,专业游戏开发者的价值会迁移到哪里?是系统设计、工程稳定性、体验调优、审美判断,还是商业化运营?
Heath:专业游戏开发者的价值不会消失,而是会迁移到更高层。
AI 可以让普通人做出一个可玩的初版,但要做出真正好玩的、可持续运营的、高留存的游戏,仍然需要专业能力。未来专业开发者的价值会集中在几个方面:系统设计、玩法节奏、数值平衡、叙事结构、体验调优、审美判断、工程稳定性、数据分析和商业化运营。
这有点像短视频时代。手机让人人都能拍视频,但优秀导演、剪辑师、编剧和运营仍然稀缺。AI 游戏也是一样,工具会普及,但好内容、好系统、好体验仍然稀缺。我们希望 Yoroll 让普通创作者能开始做游戏,也让专业开发者用更高效率做出过去做不起的内容。
InfoQ:当前世界模型等 AI 技术,对开发、美术、策划、编剧、测试等不同岗位分别产生了哪些影响?哪些岗位最先被改造,哪些能力反而会变得更稀缺?
Heath:最先被改造的是内容生产链条里的执行型岗位和重复性工作。
美术会从大量手工出图,变成更多做风格定义、角色设定、视觉审核和一致性控制。编剧会从单线写作,变成设计世界观、人物关系、剧情图和多分支结构。策划会从写大量静态配置,变成设计玩法组件、状态系统和 AI 生成边界。开发会从单纯实现具体内容,转向搭建工具链、状态系统、编辑器、自动测试和运行框架。
测试会变得更重要,因为 AI 内容有不确定性,需要做路径测试、状态一致性测试、内容安全测试和可通关性验证。
更稀缺的能力会是“跨学科能力”和“好奇心”,未来最重要的人才,可能不是单一职能专家,而是能把 AI 能力转化成稳定用户体验的人。
商业价值在于“游戏消费”和“IP 放大”
InfoQ:《丧尸清道夫》确实有传播热度,你们规划的商业化会如何走?这类互动游戏的商业价值是更多来自游戏本身,还是来自 IP 孵化或者其他方面?
Heath:我们不想只用单个案例的短期收入来判断它的意义。早期更重要的是验证三件事:第一,创作者是否能用更低成本做出可传播内容;第二,用户是否愿意点击、互动、评论和二创;第三,这类内容是否有机会从短视频热度延展成游戏、IP 和社区。
这类互动游戏的商业价值不只来自游戏本身。它可能来自章节付费、广告、内购,也可能来自 IP 孵化、粉丝社群、二创传播、品牌合作和后续改编。
尤其在 AI 时代,一个内容如果能快速生成多个版本、多个角色线、多个结局,它的 IP 生命周期会被拉长。用户不只是看完一次,而是可以参与、改写、复玩和分享。
所以我们认为,AI 互动游戏的商业价值会同时来自“游戏消费”和“IP 放大”。
InfoQ:AI 互动游戏是否更适合在自媒体平台上实现“刷到即玩”?收入模式上,会走买断制、订阅制、广告制、内购制,还是更接近短剧分账、章节付费和内容平台抽成?商业化难点在哪里?
Heath:我认为 AI 互动游戏非常适合“刷到即玩”。
它不像传统游戏那样一定要下载、安装、学习操作。一个用户在短视频平台刷到一个剧情冲突,可以马上点进去选择下一步,几秒钟内进入互动。这种分发方式非常接近短视频和短剧,但体验上又比纯视频更深。
收入模式不会只有一种。
在 Steam 或 App Store 上,可以是买断制或内购;在短视频和小程序场景里,可以是广告、章节付费、短剧分账;在创作者平台里,可以是订阅、工具收费、生成点数和平台抽成;在 IP 合作里,可以是技术服务费、联运分成和授权。
商业化难点主要有三个:第一,内容质量要足够高,不能只是 AI 噱头;第二,互动链路要足够顺滑,不能让用户等待太久;第三,付费点要设计得像游戏,而不是粗暴地照搬短剧付费。
AI 互动游戏真正的机会,是把短剧的传播效率和游戏的复玩、内购、成长、收藏、二创结合起来。
“传统游戏公司的护城河还在,但会重新分层”
InfoQ:世界模型现在冲击最大的是传统 3A、独立游戏、互动影游、UGC 平台,还是短视频/短剧式内容生态?为什么?传统游戏公司的护城河是否还在,还能持续多久?
Heath:短期冲击最大的不是传统 3A,而是互动影游、视觉小说、短剧式内容和 UGC 平台。
3A 游戏的复杂度非常高,涉及 3D 场景、复杂战斗系统、大型关卡设计、多人联机、性能优化等,世界模型短期内不会直接替代这套体系。传统大厂在工程、IP、发行、资金和组织能力上的护城河仍然很强。
但在互动影游、短剧、恋爱模拟、剧情探索、轻量叙事游戏这些领域,生成式视频和世界模型的冲击会非常快。因为这些品类的核心不是复杂物理模拟,而是角色、剧情、镜头、情绪和玩家选择。生成式视频和世界模型天然擅长增强这些部分。
UGC 平台也会被重塑。过去 UGC 游戏创作仍然要求用户掌握一定的代码、建模、关卡和工具能力。未来创作者可能只需要提供故事设定、人物关系、几张参考图和一些关键剧情节点,就能生成一个可玩的互动内容。
传统游戏公司的护城河还在,但会重新分层。越依赖复杂工程和长线运营的品类,护城河越持久;越依赖内容生产和叙事表达的品类,被 AI 改造的速度会越快。
InfoQ:现在大家对“世界模型是否会代替传统游戏引擎”有很多讨论。Unity、Epic 的 CEO 更倾向于认为 AI 是加速器,世界模型会与游戏引擎融合共生。但你们似乎更强调“绕开”或“替代”传统游戏开发流程,为什么?
Heath:我们并不是说世界模型会立刻替代 Unity 或 Unreal。对于复杂 3D 游戏、竞技游戏、大型开放世界和高精度模拟,传统引擎仍然非常重要。
我们的“绕开”,主要是针对某些内容品类的生产流程。比如互动影游、AI 短剧、视觉小说、恋爱模拟、剧情探索、轻量动作和 UGC 内容,传统引擎流程其实太重了。创作者想表达的是一个故事、一个角色关系、一个场景冲突,但被迫学习建模、动画、蓝图、脚本和资源管理。
在这些场景里,世界模型可以绕开传统重资产流程。创作者不需要先建一个完整 3D 场景,而是用 Prompt、图片、视频和剧情节点生成可交互内容。
所以准确说,我们不是要在所有品类里替代游戏引擎,而是要创造一个“视频原生”的新引擎范式。它和传统引擎会长期共存,但会覆盖一批过去用传统引擎做起来太重的新内容,让那个普通人也能做游戏。
InfoQ:当世界模型被广泛应用,未来游戏行业会不会从“少数公司开发爆款大作”,走向“大量创作者生成可玩的互动世界”?这种变化对行业格局意味着什么?
Heath:我认为会,而且这是一个非常大的变化。
过去游戏行业的供给是高度集中的。少数公司掌握工具、人才、资金和发行渠道,负责生产大多数高质量内容。普通创作者即便有很好的故事、人物和世界观,也很难把它变成游戏。
世界模型会让游戏创作从“工业生产”向“创作者生产”扩展。未来可能会有大量小说作者、短视频创作者、AI 视频创作者、同人创作者、独立导演,把自己的故事变成可玩的互动世界,一个人做出爆款大型游戏的故事会持续上演。
这并不意味着所有人都会做出好游戏。门槛降低之后,一定会出现内容爆发,也会出现低质内容泛滥。但长期看,行业格局会从“少数公司生产内容,玩家消费内容”,变成“平台提供工具和分发,创作者持续生产互动内容,玩家同时也是参与者和二创者”。
这更像 Roblox、TikTok、Steam 创意工坊和短剧平台的某种结合,只不过内容形态从视频和游戏,进一步走向“可玩的生成式视频世界”。
本文来源:InfoQ