AI 资讯

阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一

AI_light

10 May 2026 • 4 min read

阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一 – 量子位

首页

资讯

智能车

智库

活动

MEET大会

AIGC

扫码关注量子位

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一

量子位的朋友们

2026-05-09

18:29:31

来源：

量子位

5 月 9 日，全球权威 TTS 评测榜单

Artificial Analysis Speech Arena Leaderboard

更新，阶跃语音生成模型

StepAudio 2.5 TTS

跻身全球前三，成为当前榜单排名最高的中国大模型。

不同于传统实验室指标，该榜单采用盲测 Elo 评分机制，由用户在不知道模型身份的情况下，直接对同一文本生成的两段语音进行听感判断，测试覆盖客户服务、知识分享、数字助手、娱乐等真实应用场景。这意味着，StepAudio 2.5 TTS 的领先并不只是参数或指标上的提升，而是在真实用户听感中展现出更自然、更接近真人表达的能力，在实际落地中具备更强竞争力。

据了解，阶跃近期集中发布 StepAudio 2.5 系列模型，包括

TTS、ASR 和 Realtime

三款模型，覆盖语音生成、语音识别与实时语音交互全链路。其中，

StepAudio 2.5 TTS

面向高自然度语音生成，

StepAudio 2.5 ASR

主打高速高精度识别，就在昨日

StepAudio 2.5 Realtime

也火速上线，聚焦打造更有“活人感”的 AI 聊天搭子，具备顶级副语言能力、千万人设自定义、领先智商情商等特点，强调带来“有温度、有灵魂、有态度”的实时语音交互体验。

AI 语音模型一直被行业视为实现人机交互的核心入口，包括 OpenAI、Google 等全球顶尖科技公司均在长期且高强度投入。记者观察到，阶跃在 AI 语音领域已进行长期深度布局：开源原生推理语音模型 Step Audio R1.1 已连续 4 个月霸榜 Artificial Analysis Speech Reasoning，目前仍位于全球第一；开源全球首个迭代式情绪风格语音编辑模型 Step Audio EditX，该模型为 zero-shot TTS，仅用 3s 复刻的音色效果可打败许多闭源 TTS 模型主音色；目前位列

Artificial Analysis Speech Arena Leaderboard

开源榜全球第二。

在商业化方面，阶跃语音模型已在多个核心终端场景实现规模化商业落地。比如搭载吉利银河 M9，阶跃率先实现端到端语音大模型量产上车；为整车智能体超级 Eva 提供语音交互能力，首发搭载极氪 8X 也已实现量产上市。

-本文系量子位授权转载-

量子位的朋友们

太初元碁携龙虾一体机亮相北京科博会

2026-05-09

两项AI政策发布，范式智能战略布局与产业方向高度契合

2026-05-09

空间智能的“具身化”跃迁，高德ABot体系模型夺冠AGIBot全球挑战赛

2026-05-09

美图RoboNeo全新升级：首创影像创作Agent Teams

2026-05-09

扫码分享至朋友圈

阶跃最新语音模型位列 Artificial Analysis 评测榜中国第一

AI_light

Sign up for more like this.

具身智能Skill时刻！英伟达开源机器人技能库，Jim Fan：范式变了

在企业内部构建欧洲云编排平台

Cloudflare 推出支持零信任部署和迁移的代理技能