阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro

每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。

阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro – 量子位

首页

资讯

智能车

智库

活动

MEET大会

AIGC

扫码关注量子位

< img id="wx_img" src="https://www.qbitai.com/wp-content/uploads/imgs/qbitai-logo-1.png" width="400" height="400">

阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro

量子位的朋友们

2026-03-30

22:21:45

来源:

量子位

每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。

3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控的结构化描述,可识别语言和方言数量多达113种,还惊喜地涌现出了音视频Vibe Coding能力,用户对着镜头阐述需求,就能让模型自主生成APP、网页、游戏等复杂产品代码。目前,阿里云百炼已上新Qwen3.5-Omni的Plus、Flash、Light三种API,可广泛应用于短视频/直播平台、游戏、自媒体等行业。

Qwen3.5-Omni采用混合注意力MoE架构,在海量文本、视觉以及超过1亿小时的音视频数据上进行了原生多模态预训练,可实现图片、视频、语音、文字等全模态内容的输入与输出。新模型在音视频理解、跨模态推理、Agent方面实现了性能飞跃,在音视频理解、语音识别、多语种翻译、对话等215项第三方性能测试任务中取得SOTA。比如,在聚焦视听交互能力的DailyOmni、QualcommInteractive、Omni Cloze等测试中,Qwen3.5-Omni得分大幅领先Gemini-3.1 Pro;在检测嘈杂环境抗干扰能力的WenetSpeech测试中,Qwen3.5-Omni错误率远低于Gemini,识别准确率极高;在考察多语言语音生成质量的Multi-Lingual (30lang) 测试中,Qwen3.5-Omni同样显著优于Gemini-2.5-Pro-TTS。

图说:Qwen3.5-Omni跑分图

Qwen3.5-Omni拥有极强的语言能力,支持113种语言及方言的语音识别和36种语言及方言的语音生成,就连使用人数不足一百万的毛利语和国内的海南方言,也能精准识别。新模型还大幅增强了实时交互体验,能高情商听懂用户对话意图,准确区分有效回应和随口附和,就像和真人聊天一样。同时,模型还可以根据指令自由调节语音、语调,并基于创新的ARIA技术,使生成的语音更自然、更稳定。 在面对类似“今天的天气怎样”的实时提问时,模型还能自主判断并调用工具,确保回复内容准确且时效性强。

基于一系列技术创新,Qwen3.5-Omni将Vibe Coding推入下一阶段。与纯文本或图片驱动的Vibe Coding不同,千问可以实现音视频编程:打开摄像头,用户对着草图口述需求,哪怕是包括复杂产品逻辑的描述,模型也能直接生成带有复杂UI的产品原型界面,真正实现“动动嘴即可编程”。这一能力并非刻意设计,而是模型在原生多模态能力持续扩展过程中自然涌现出的结果。

Qwen3.5-Omni顶尖的全模态能力,还能为专业领域带来超级生产力。新模型可对画面主体、人物关系、对话逻辑、乃至人物情绪起伏进行极细的拆解,并自动完成视频章节切片与时间戳标注,支持超过10小时的音频输入,将繁琐的视频后期梳理工作缩短至秒级,大幅降低了企业的内容管理成本,在视频创作、内容审核等领域具有极高的落地价值。

目前,普通用户也可前往Qwen Chat免费体验,开发者和企业可通过阿里云百炼平台调用Qwen3.5-Omni模型,每百万Tokens输入不到0.8元,比Gemini-3.1 Pro的1/10还低。据了解,千问稳居中国企业级大模型调用市场第一,服务涵盖互联网、金融、消费电子及汽车等重点行业超100万家客户。

附:

图说:Qwen3.5-Omni跑分图

(完)

来源:阿里云

版权所有,未经授权不得以任何形式转载及使用,违者必究。

阿里云

量子位的朋友们

Nature Index特刊聚焦天立国际:系统呈现中国教育AGI实践探索

2026-03-30

国产世界模型登顶全球第一!断层领先谷歌英伟达,3D准确度近满分

2026-03-30

打破代码大模型训练瓶颈:MicroCoder将算法数据框架训练经验升级

2026-03-30

风云G会圆满落幕 共绘GEO行业可信协同发展新蓝图

2026-03-29

扫码分享至朋友圈

相关阅读

600多所高校、13000支队伍参赛,首届全球人工智能技术创新大赛风靡全球

为了推动 AI 技术的应用创新,促进人工智能领域的学术交流、人才培养,打造人工智能的人才交流平台与产业生态圈,中国人工智能学会联合杭州市余杭区人民政府联合发起了首届全球人工智能技术创新大赛,并得到了阿里云、OPPO等头部科技企业的积极参与和支持。阿里云天池平台作为本次大赛的官方竞赛平台,为大赛提供平台和算力支撑。

量子位

2021-04-12

大赛

阿里云

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

最强版本450B MoE,激活参数35B

闻乐

2025-07-23

Qwen

通义

阿里云

阿里云疯狂星期四!史上最大力度降价来了:100+云产品官网直降20%

“用阿里云的客户越多,价格就会越便宜。”

鱼羊

2024-02-29

阿里云

降价

看病、购物都好用!海南发布“码上办事”APP

2020阿里云峰会上,海南省正式发布了“码上办事”APP (Hainan Pass)

晶少

2020-06-09

“码上办事”APP

海南

阿里云

AI火花集|10位AI火花先锋揭晓,看AI应用如何“改写”商业世界?

十位“阿里云年度AI火花先锋”正式揭晓

一水

2025-04-17

阿里云

燃爆!奥运8分钟AI影片火了,巴赫主席:感谢中国黑科技

本届奥运会上AI技术已遍地开花

鱼羊

2024-07-29

奥运会

阿里云

热门文章

OpenClaw逼出Claude最强反击!GUI操控电脑和真人无差别,网友:这得花多少token?

2026-03-24

龙虾史上最大升级!但接了微信的千万别更

2026-03-24

第一批“首席龙虾官”,月薪6万

2026-03-25

OpenAI关停Sora!25个月从封神到退场

2026-03-25

谷歌新论文把内存股价干崩了!KV cache压缩6倍,网友:硅谷成真了 profile-avatar

2026-03-26

关于量子位

加入我们

寻求报道

商务合作

扫码关注量子位

追踪人工智能新趋势,报道科技行业新突破

量子位 QbitAI 版权所有©北京极客伙伴科技有限公司

京ICP备17005886号-1


本文来源:量子位