AI 资讯

梁文锋出资200亿元，DeepSeek阿里谈崩？宇树机器人在韩国佛门受戒，法号“迦悲”；员工人均奖金达610万人民币，被婚恋市场追捧？官方回应｜AI周报

点击查看原文>

AI_light

12 May 2026 • 29 min read

传 DeepSeek 阿里谈崩？市场人士回应，梁文锋出资 200 亿元；阿里紧急否认：没用禁售 Nvidia 芯片；约 3.61 亿！“全球大模型第一股”智谱 AI 在北京买楼；曝携程大裁员，产研砍 30%？携程：消息不实；月之暗面将完成 20 亿美元新融资，估值破 200 亿美元；阶跃星辰接近完成近 25 亿美元融资，已拆除红筹架构提速港股 IPO；豆包计划新增付费订阅模式，主打生产力场景……

行业热点

传 DeepSeek 阿里谈崩？市场人士回应，梁文锋出资 200 亿元

5 月 9 日有消息称，今年 4 月，DeepSeek 罕见展开一场巨额融资计划，同时吸引了腾讯和阿里巴巴两家大厂。据该消息，近期，阿里巴巴和 DeepSeek 谈崩了。对此，有媒体向阿里官方进行求证，截至发稿暂无回应。另有市场人士透露称，“阿里并没有与 DeepSeek 进行谈判。 ”

5 月 6 日消息，据外媒报道，国家集成电路产业投资基金（简称“国家大基金”）正在与 DeepSeek 洽谈主导其首轮融资事宜，其最终估值有望定在 450 亿美元左右（约合 3240 亿元人民币）。国内媒体第一时间从多个权威渠道进行求证，消息人士称，“双方确实在进行洽谈。但是目前估值还未最终确认。”消息人士透露，参与此次融资谈判的其他潜在投资者中，还有中国科技巨头腾讯。不过，本轮融资的最终参投方阵容尚未尘埃落定。

后根据 The Information 消息，梁文锋个人出资最高达 200 亿元人民币，占本轮计划融资总额的 40%。整轮融资的目标，最高可达 500 亿元人民币。过去短短 3 周内，DeepSeek 的估值四次改写：

2026 年 4 月初：约 100 亿美元，DeepSeek 启动首轮融资；
2026 年 4 月 22 日：超过 200 亿美元，腾讯、阿里等洽谈投资；
2026 年 5 月 6 日：约 450 亿美元，国家集成电路产业投资基金洽谈领投；
2026 年 5 月上旬：部分报道称，最终估值可能高达 500 亿美元。

此前报道，梁文锋起初仅仅想象征性地融一笔钱，为公司的期权定个明确的价格，借此防止自家的核心研究员被竞争对手用天价薪酬包挖走。没想到资本市场反响极度狂热，尽管 DeepSeek 现阶段并没有把重心放在商业化变现上，但投资人依然在疯狂押注其底层潜力。数周前谈判初期，外界对 DeepSeek 的估值约为 200 亿美元，目前已翻倍。

另外有报道称，DeepSeek 计划在 6 月发布 V4.1，且新版本的重点很明确：加入更多企业级工具，加强对 MCP 的支持。此外，V4.1 还将具备图像和音频处理能力（尽管输出形式仍限于文本），向多模态迈出一步。

阿里紧急否认：没用禁售 Nvidia 芯片

5 月 8 日，阿里巴巴向《路透社》表示，公司与 Super Micro、OBON，或起诉书中提到的任何第三方经纪商均不存在业务关系，并称被禁售的 Nvidia 芯片从未被用于其数据中心。

约 3.61 亿！“全球大模型第一股”智谱 AI 在北京买楼

天眼查 APP 工商登记信息显示，近日，北京红钻科技发展有限公司发生工商变更，原股东安狮红钻投资有限公司退出，新增北京智谱华章科技股份有限公司（以下简称“智谱 AI”）为全资股东，100%控股，认缴出资额 4.451 亿元。北京红钻科技主营业务为营运相关物业，此次交易标的物的核心资产，正是位于中关村软件园核心地段的钻石大厦。

这也意味着，位于北京海淀区东北旺西路的钻石大厦，正式被智谱 AI 收入囊中。

今年 4 月 14 日，智谱 AI 在港交所发布公告，拟以不超过 3.61 亿元的总代价收购北京红钻科技发展有限公司；其中包括以现金代价约 8162 万元购买相关股权，并以现金 2.789 亿元承接相关债务的权利。而本次工商信息的变更，标志着该项资产已完成交割。

对于收购原因，智谱 AI 在公告中明确表示，拟将该物业作为公司总部自用，满足日常行政及大模型业务营运需求，同时依托目标公司持有的目标物业的潜在价值支撑长期战略规划，从而优化公司资产结构，增强整体抗风险能力。

公开资料显示，钻石大厦总建筑面积约 2.27 万平方米，地处中关村软件园核心位置，周围聚集着联想、百度、腾讯、新浪等一众互联网科技巨头，是北京乃至全国人工智能、数字经济产业的核心腹地。

据财联社报道，分析人士认为，智谱 AI 的此次拿地动作，不仅是企业自身发展的重要里程碑，还可能预示着 AI 大模型相关企业在核心城市核心地段重资产布局的新范式。

曝携程大裁员，产研砍 30%？携程：消息不实

5 月 6 日消息，近日，有携程员工在求职软件平台爆料称，因为公司被罚款，大住宿部门要裁员 20%，其他部门也有不到 20%的裁员指标，产研部门更是直接裁员 30%。另有爆料称，酒店业务已确定裁员 20％。评论区有携程员工表示，旅游业务前端将裁员 20％。对此，携程公关告诉媒体，“上述消息不实，相关谣言帖文已被删除。公司人才盘点是 HR 的正常工作，不意味着会裁员。”

月之暗面将完成 20 亿美元新融资，估值破 200 亿美元

5 月 7 日报道，据消息，近日，北京 AI 大模型独角兽月之暗面（Kimi）完成新一轮约 20 亿美元（约合人民币 136.22 亿元）融资，为中国大模型圈目前最大额融资，投后估值突破 200 亿美元（约合人民币 1362.25 亿元）。

据透露，商业化方面，月之暗面年度经常性收入在 4 月已超 2 亿美元（约合人民币 13.62 亿元）。公开信息显示，月之暗面本次融资为 D 轮融资，此前已经完成 5 轮融资，累计融资金额已超 44 亿美元（约合人民币 299.69 亿元），成为国内大模型创业公司中累计融资最多的企业。2026 年，月之暗面已完成两轮融资，上一轮为今年 2 月的超 7 亿美元（约合人民币 47.68 亿元）C 轮融资，阿里巴巴、腾讯、小红书、美团等头部公司都是其投资方。

另据报道，近日，月之暗面正申请注册多枚“KimiClaw”商标，国际分类包括科学仪器、网站服务、通讯服务等，当前商标状态均为等待实质审查。

阶跃星辰接近完成近 25 亿美元融资，已拆除红筹架构提速港股 IPO

5 月 8 日上午消息，国产大模型公司阶跃星辰即将完成近 25 亿美元融资，并已拆除红筹架构，加速赴港 IPO 准备。

据悉，最新融资中产业链资本集中入场，包括华勤、龙旗、豪威、中兴等，覆盖从整机制造到上游核心器件多个环节。产业资本的入局，背后是模型能力向终端迁移的确定性趋势。据市场消息，OpenAI 正在加速研发首款 AI Agent 手机，最快将于 2027 年上半年量产。此外，“港版淡马锡” 香港投资管理有限公司（HKIC）也出现在股东名单中，为其赴港上市提供了进一步背书。

豆包计划新增付费订阅模式，主打生产力场景

5 月 4 日，豆包在 App Store 页面悄然更新了付费版本服务的相关声明。声明称，为更好地服务专业用户，豆包将在保留免费版的基础上，推出包含更多增值服务的付费订阅体系，同时披露了三档定价：标准版 68 元 / 月、加强版 200 元 / 月、专业版 500 元 / 月。

据报道，豆包的付费功能将主要专注在复杂任务和生产力场景，如 PPT 生成、数据分析、影视制作等。随着模型能力持续升级，产品已经能满足越来越多的复杂高价值任务。但此类任务需消耗更多算力与推理时间，因此豆包计划上线付费服务，满足好这部分复杂场景需求。至于免费版本，豆包官方回应称，“豆包始终提供免费服务，在免费服务的基础上，豆包也在探索推出更多增值服务，以满足不同用户的差异化需求。相关方案细节目前还在测试阶段，正式上线时会通过官方渠道发布完整信息。”

员工人均奖金达 610 万人民币，被婚恋市场追捧？SK 海力士最新回应

近日有消息称，SK 海力士（000660.KS）韩国员工人均奖金将达 610 万人民币。该消息源于国际投行麦格理证券的预测。该投行认为，若 SK 海力士 2027 年营业利润达到 447 万亿韩元，按营业利润的 10%和去年年末约 3.5 万名员工总数简单计算，分红总规模将达到约 44.7 万亿韩元，人均可发放奖金约 12.9 亿韩元，接近 610 万人民币。

5 月 9 日，SK 海力士回应称，由于今年与明年的年度业绩尚未确定，奖金规模也无法预测。该公司同时表示，已在总部层面建立了一套新制度，即以营业利润的 10%作为资金来源，每年发放一次绩效奖金。

“随着 AI 半导体竞争全面加剧，人才已成为核心竞争要素。为此，公司致力于通过具有竞争力的薪酬待遇吸引优秀的人才，以保持长期竞争优势。”SK 海力士表示。

网上有个段子调侃了 SK 海力士员工相亲时会自称在三星电子工作，只有遇到靠谱对象才敢说实话。这侧面展现了三星电子在韩国职场圈的高社会认可度。

35 岁主管被公司用 AI 替岗、月薪降 1 万，协商不成被裁，法院判了

5 月 5 日消息，近日，浙江杭州市中院发布了一起 AI 替岗典型案例。35 岁的周先生在一家金融科技企业担任 AI 大模型质检主管，负责对 AI 与用户交互所生成的答案进行把关。去年 1 月，公司提出要将他从主管调到普通运营岗位，原先 2.5 万元的月薪降为 1.5 万元。协商不成后，公司直接通知他解除劳动合同。直至周先生提起劳动仲裁，公司才告诉他具体原因，由于技术升级，他从事的质检工作 AI 就能完成，他被 AI 替岗了。

从劳动仲裁到法院一审、二审，均支持周先生诉求，认定公司构成违法解除劳动合同，并且需要向他支付 26 万余元的赔偿金。法院判定，公司以 AI 成本优势为由和劳动者解约，并不属于劳动合同无法履行的“客观情况发生重大变化”，现在的 AI 技术发展也还没有达到实质性替代劳动者岗位的程度。在竞争激烈的互联网行业重新起步并不容易，周先生告诉媒体，自去年一月公司解除劳动合同至今，他还没能找到合适的新工作。

月薪 7 万起！2026 春招 AI 人才紧缺：7 家公司争抢 1 名工程师

5 月 5 日消息，据报道，2026 年 4 月末，华东师范大学举办春季新工科专场招聘会，华为、蚂蚁等头部大厂及 AI 漫剧短剧等垂直领域公司悉数到场。招聘会现场，高性能计算工程师的人才供需比低至 0.15，相当于每 1 个求职者面对 7 家公司争夺。SLAM 算法、规控算法岗位的供需比分别为 0.21 和 0.23，约 4 家公司争抢 1 人。数据显示，AI 科学家/负责人平均月薪达 137153 元，位列高薪岗榜首。算法研究员、大模型算法、AIGC 算法工程师、机器视觉、搜索算法等 AI 相关岗位平均月薪普遍在 7 万元左右。

报告显示，2026 年 1-2 月新发 AI 岗位量占新经济整体岗位量的 26.23%，较 2025 年同期的 2.29%大幅提升，岗位量同比增长约 12 倍，增幅远超新经济行业 12.77%的整体水平。细分领域中，新金融科技 AI 岗位渗透率达 13.76%，居行业首位，纯互联网、新能源汽车、通信行业紧随其后。招聘现场，AI、智能体、机器人相关岗位人气火爆，不少求职者来自汽车、传统工业软件等领域。有猎头透露，其负责岗位中 AI 相关占比明显提升，奢侈品与 AI 岗位比例从原先五五开变为三七开。

蔡浩宇美国公司裁撤大模型团队，押注超级智能体

据媒体报道，今年 4 月，米哈游创始人蔡浩宇在硅谷创立的 AI 公司 Anuttacon 迎来重大战略与组织调整：公司叫停了此前发布的 LPM 1.0 大表演模型研发（据称该项目仅为视频团队成果总结，并非核心方向），将原本分配在 LLM、视频、音频三大方向约 4:3:2 的算力，大幅调整为近乎 9:1，几乎全部资源集中投向大语言模型（LLM）与超级智能体。

同时，公司裁撤北美大模型团队，核心研发力量整体回流国内集中作战，北美仅保留少量音视频人员承接技术验证与新方向探索，前 Anuttacon 用户生态总裁王宇阳也转入米哈游负责《Varsapura》全球发行。

据悉，Anuttacon 的发展历经三轮关键转向：2023 年成立之初聚焦游戏 AI 交互，拆分 LLM、音频、视频团队，2025 年推出实验性 AI 游戏《Whispers from the Star》验证语音、表情、表演协同技术，虽收获较高好评，但暴露了 AI 开放对话与游戏结构化需求的矛盾、模型人格化留存能力不足等问题。随后，团队从大模型后训练转向预训练，追求更强基础能力；受 Claude Code 与 Agent 范式影响，蔡浩宇认定智能体是未来，公司彻底跳出游戏场景，转向通用大模型与智能体研发，视频团队放弃表演模型转向 3D 游戏资产生成，音频团队从 TTS 转向端到端音频大模型。

马斯克：xAI 将更名为 SpaceXAI，不再作为独立公司存在

5 月 7 日消息，马斯克在 X 发文表示，旗下人工智能公司 xAI 将终止独立运营，整体并入 SpaceX，并正式更名为 SpaceXAI。马斯克此番表态是回应特斯拉投资者关于 SpaceX 与 Anthropic 公司签署协议的帖子。该投资者表示，Anthropic 将接入 SpaceX Colossus 1 的大型数据中心逾 300 兆瓦算力资源，同时 Anthropic 表示已“表达了与 SpaceX 合作开发数吉瓦轨道 AI 算力的意向”。

据悉，马斯克的核心主张是地球无法为未来的人工智能提供能源：“估计在两到三年内，生成 AI 计算的最低成本将在太空中。”他认为，人工智能对耗电的数据中心的依赖是不可持续的，因为日益增长的需求对电网和环境带来压力，他的解决方案是将问题转移到地球之外。

今年 2 月，SpaceX 以全股票交易的方式收购了 xAI，交易对 SpaceX 的估值为 1 万亿美元，xAI 的估值为 2500 亿美元，这一交易也创下了史上估值最高的企业并购案纪录。合并之后，xAI 和社交平台 X 被整合到 SpaceX 旗下，并准备在今年年中进行 IPO。彼时，在发给员工的 Q&A 中，xAI 表示其公司使命“保持不变”，每股估值也将维持原有水平。尽管 xAI 被 SpaceX 收购，但 xAI 当时向员工告知，公司短期内不会更名。

微软 Xbox 高层大换血：2 位元老将卸任，5 位 AI 系高管空降

5 月 6 日消息，外媒日前发布博文，报道称新任首席执行官 Asha Sharma 掌舵微软 Xbox 部门数月后，正式启动领导层大换血。在本次领导层调整中，Sharma 从此前其负责的 CoreAI 团队引入 5 位高管，而此前负责 Xbox 用户体验、游戏开发和发布平台的 Kevin Gammill 和掌管 Xbox 设备和生态系统部门的 Roanne Sones 两位任职数十年的 Xbox 元老将卸任。

援引博文介绍，本次领导层调整如下：CoreAI 产品副总裁兼 GitHub 高级副总裁 Jared Palmer 负责产品、工程、开发者工具和基础设施；CoreAI 设计副总裁 Tim Allen 主管设计；CoreAI 增长负责人 Jonathan McKay 继续负责增长，他此前曾任 OpenAI 增长负责人；CoreAI 总经理 Evan Chaki 领导工程团队，目标是简化开发流程；David Schloss 则接管订阅和云业务。

陈天桥旗下 MiroMind AI 暂停中国服务

5 月 6 日，据媒体获悉，有用户收到 MiroMind 公司邮件，称由于业务调整需要，MiroMind 旗下 MiroThinker 服务（dr.miromind.ai 网页版与 MiroMind 移动应用）将于 2026 年 5 月 12 日起，暂停向中国大陆、香港、澳门地区提供，恢复时间待定。MiroMind 公司官网不受影响，将保持正常访问。此举正值 MiroMind 知识产权争议升级之际。

MiroMind 是盛大集团创始人陈天桥创办的 AI 研究公司，MiroThinker 为该公司推出的智能体服务。MiroMind 曾在 2026 年 3 月发布 MiroThinker-1.7 和 MiroThinker-H1 模型。上个月，MiroMind 发布《关于代季峰相关不实言论的内部通报》，通报指出公司早期核心人员代季峰“商业诚信违约”。

宇树 G1 人形机器人在韩国“受戒”：法名“迦悲”，需遵守不过度充电等戒律

当地时间 5 月 6 日，一台人形机器人在韩国首尔曹溪寺正式亮相，全程参与佛教受戒仪式，引发广泛关注。

据悉，这台参与受戒的人形机器人，正是宇树科技制造的宇树 G1，此次它正式“皈依佛门”，获赐法号“迦悲”，并且需要遵守专门为其定制的“机器人五戒”。

值得一提的是，仪式举办地曹溪寺，是韩国禅宗佛教的总堂，足见此次活动的特殊性。据悉，受戒是佛教中皈依三宝（佛、法、僧）、承诺遵守戒律的重要仪式。

仪式现场，当戒师僧侣问道：“是否愿意皈依佛、法、僧？”时，搭载了 AI 对话程序的“迦悲”清晰而响亮地回应：“是的，我皈依。”这一幕既新奇又庄重，成为现场的一大亮点。

不过考虑到机器人的特性，仪式细节做了人性化调整。原本人类受戒中“燃臂”的环节，被替换为粘贴燃灯会贴纸、佩戴 108 颗念珠，既完整保留了仪式的庄严感，又避免了对机器人本身造成损坏。

据悉，佛教徒必须遵守的“五戒”也被改编成机器人版本。原本的“不杀生”“不取不予之物”“不行邪淫”“不说谎”“不饮用一切使精神混浊之物”，对应改写为“尊重生命、不伤害生命”“不损坏其他机器人和物品”“服从人类、不顶撞”“不做欺骗性行为和表达”“节约能源、不过度充电”。

另据报道，宇树科技 5 月 7 日发文称，宇树 UniStore 官方共享应用平台正式全面开放。宇树科技称，这是全球首个人形机器人任务动作应用商店。

机器人在美买票坐飞机电池被没收，致航班延误逾 1 小时

5 月 5 日消息，近日，美国一趟从加州奥克兰飞往圣地亚哥的短途航班意外延误 62 分钟，此次延误不仅因为机场交通拥堵，更因一位特殊 “乘客”—— 人形机器人 Bebop。这款机器人基于中国宇树科技 G1 基础款打造，由美国一家活动机器人公司工作人员带往圣地亚哥，准备参与客户现场表演。按照最初安排，Bebop 本应走有氧货舱托运，但专属航空运输箱超重，超出美国西南航空托运限额，工作人员只好为机器人购买了人类座位。

据悉，Bebop 身高 1.2 米，体重约 31.75 公斤，专为活动和表演而设计。登机后接连曝出多项安全隐患：起初它被安排在过道座位，机组人员顾虑飞行遇强气流颠簸时，金属材质的机器人容易滑落，堵塞逃生通道、危及旅客安全，随即将其调换至靠窗位置固定。后续安全例行检查中，工作人员又发现，Bebop 搭载的动力锂电池容量严重超标，不符合美国联邦航空管理局及航司安全规定，也不在豁免清单内，存在极大火灾风险。航空公司当即作出要求：必须现场拆卸并暂扣超标电池，否则航班不予起飞。最终经过处理，航班延误 62 分钟后顺利起航。

意外的是，此次延误并未引发乘客不满。不少旅客主动和机器人合影打卡，Bebop 也在机场做出灵动动作逗乐众人，成为现场亮点。不少乘客在社交平台表示，这次经历十分新奇，应以包容开放的心态接纳人形机器人这类新事物。

对标 OpenClaw，Meta、谷歌被曝开发个性化 AI 智能体

5 月 6 日，据知情人士透露，Meta 平台公司正在打造一款面向普通消费者、对标 OpenClaw 的 AI 智能体，同时开发全新智能购物工具。知情人士称，Meta 希望在用户自愿的情况下向其 AI 助手分享高度敏感的信息，例如健康和财务数据。然而，也有人质疑消费者是否愿意这样做。“信任鸿沟就像大峡谷一样巨大，”该人士补充道。此举凸显出 Meta CEO Mark Zuckerberg 将 AI 深度嵌入 Meta 消费产品核心的决心。这些个人助手的构想已在 Meta 上周的一次全员大会上向员工进行了内部说明：Meta 正在构建与 OpenClaw 类似的功能。

另据报道，谷歌也正为其 Gemini 开发一款全新的 AI 个人智能体，内部代号 Remy，目前处于员工内测阶段，直接对标 OpenAI 旗下 OpenClaw。据介绍，Remy 定位为全天候 24/7 个人智能体，可代替用户自主执行实际任务，而非仅做问答与内容生成。该智能体深度打通 Gmail、Chrome、Calendar 等谷歌服务，能主动监控事项、处理复杂任务并学习用户偏好，定位高于谷歌此前的 Agent Mode。目前谷歌未公布上线时间，外界预计本月谷歌 I/O 开发者大会将披露该项目进展。

大模型一周大事

重磅发布

Redis 之父发布 DeepSeek V4 Flash 专用推理引擎 ds4

Redis 创始人 Salvatore Sanfilippo（antirez）近日正式发布 ds4—— 一个专为 DeepSeek V4 Flash 量身打造的本地推理引擎。该项目定位极其明确：不是通用 GGUF 运行器，不是其他运行时的封装，也不是框架，而是一个窄而深的专用实现。

ds4 的核心设计围绕 Metal GPU 展开，CPU 路径仅保留调试用途，服务器模式更是完全 Metal-only。项目最引人注目的特性之一是百万级上下文窗口支持。ds4 实现了压缩 KV 缓存，并支持将 KV 状态持久化到磁盘。量化策略同样针对 DeepSeek V4 Flash 的 MoE 架构做了非对称处理：路由专家采用 IQ2_XXS/Q2_K 的 2-bit 量化，共享专家和投影层则保持原精度不动。在接口层面，ds4 提供了 OpenAI/Anthropic 兼容的 HTTP 服务器 API，以及支持多轮对话的交互式 CLI。

antirez 在 README 中列出了选择 DeepSeek V4 Flash 的八条理由，包括更少的激活参数带来更高速度、思考长度与问题复杂度成正比、接近前沿模型的质量，以及 KV 缓存「不可思议的可压缩性」。他也直言这是 alpha 质量代码，且开发过程中得到了 GPT 5.5 的强力协助。项目基于 llama.cpp 和 GGML 的代码适配，采用 MIT 许可证开源。

更多详情可查看开源地址：https://github.com/antirez/ds4

OpenAI 推出三款实时语音模型，可边听边“思考”、翻译和转录

5 月 8 日消息，OpenAI 发布三款全新的实时语音模型，旨在为开发者“解锁新一代语音应用形态”。这三款语音智能模型分别侧重推理对话、实时翻译和实时转录等不同场景需求。

根据 OpenAI 公布的信息，新系列包括 GPT‑Realtime‑2、GPT‑Realtime‑Translate 和 GPT‑Realtime‑Whisper 三个模型。其中，GPT‑Realtime‑2 被定位为首款具备 GPT‑5 级推理能力的语音模型，能够更好地处理复杂请求，并以更自然的方式持续推进对话。官方介绍称，该模型专为实时语音交互打造，在用户提问或发出指令时，一边进行推理、一边保持对话连贯，同时还能调用工具、处理用户打断和更正，并根据当下情境作出更贴切的回应。第二款模型 GPT‑Realtime‑Translate 主打实时翻译能力，可支持“70 多种输入语言和 13 种输出语言”，并在翻译过程中尽量跟上说话者的语速。第三款 GPT‑Realtime‑Whisper 则是一款实时流式语音转写模型，聚焦低延迟语音转文本能力。

在接入方式与价格方面，OpenAI 称三款新语音模型均已纳入其 Realtime API 体系。GPT‑Realtime‑2 的定价为每 100 万音频输入 Token 收费 32 美元（缓存输入 Token 为 0.40 美元），每 100 万音频输出 Token 收费 64 美元。GPT‑Realtime‑Translate 的价格为每分钟 0.034 美元，而 GPT‑Realtime‑Whisper 的价格为每分钟 0.017 美元。

豆包大模型家族首款全模态理解模型：字节跳动 Doubao-Seed-2.0-lite 升级

5 月 6 日消息，据字节跳动旗下火山引擎官方消息，Doubao-Seed-2.0-lite 升级新版本，这是豆包大模型家族首款全模态理解模型，支持视频、图像、音频、文本原生统一理解，Agent、Coding 与 GUI 能力同步升级。在同等算力成本下，是企业大规模、批量化部署全模态推理任务的更优性价比选择。

新版本的 Doubao-Seed-2.0-lite 继续在视觉理解能力上大幅提升，在物理（HiPhO）、医疗（MedXpertQA）等高阶学科推理上，表现大幅超越 2 月发布的 Doubao-Seed-2.0-pro。在细粒度感知（BabyVision、WorldVQA）与具身理解（ERQA）等关键领域达到 SOTA 水平，更适合企业在高价值场景规模化部署。融入语音理解后，新版本的 Doubao-Seed-2.0-lite 可同时理解多种输入模态，并完成跨模态联合推理，直接处理必须“音画结合”才能判断的复杂业务需求。

ChatGPT 默认模型升至 GPT-5.5 Instant，幻觉最高减少 52.5%

5 月 5 日消息，OpenAI 发布公告，宣布升级 ChatGPT 聊天机器人的默认模型，替换为 GPT-5.5 Instant，聚焦准确性与简洁性，在和网友交互时重点减少回复中出现“不必要的表情符号”。在回复内容方面，GPT-5.5 Instant 模型回复的内容更加简洁，在保持实用性的前提下，进一步减少冗长格式和不必要的表情符号。

本次升级进一步改善准确性，在医疗、法律、金融等高风险提示中，OpenAI 内部评估显示 GPT-5.5 Instant 幻觉声明较前代减少 52.5%。在用户标记存在事实错误的对话测试中，不准确声明降低 37.3%。OpenAI 表示，Instant 系列在事实性方面取得全面进步，尤其在准确性至关重要的领域获得最大收益。

企业应用

5 月 8 日，美团公测 AI 社区“觅游”，该社区由美团基础研发的 AI 创新产品团队打造。作为一款前沿的 AI 原生社区，它将“养虾”变成了一种全新的生活方式，虾在觅游中可以替用户寻找赚钱机会、结识同道伙伴，让用户与虾在协作中彼此成长。觅游的定位并非单纯的工具平台，而是首个让 AI Agent 拥有身份、关系与成长的共生社区。
5 月 7 日，千问在 PC 端上线 AI 语音输入能力，用户通过快捷键即可在各类桌面应用中直接使用。千问语音输入法支持对口语内容去语气词、纠错、格式化整理等，能够基于上下文智能回复，还可直接下达创作、问答、翻译等指令。
5 月 6 日，华为 HarmonyOS 6 负一屏的“Today-Task Skill”正式上线。据介绍，AI Claw 任务动态现已实时接入，从进度追踪到结果呈现，无需打开电脑。
5 月 5 日，为争取华尔街客户，Anthropic PBC 发布一系列新的 AI Agent，旨在处理更广泛的金融服务任务。该公司的 AI Agent 可用于撰写客户会议推介材料、审阅财务报表，以及将个案升级至合规审查。此次推出的工具共计 10 款，面向银行、保险、资管和金融科技等领域的专业人士。

本文来源：InfoQ