梁文锋出资200亿元,DeepSeek阿里谈崩?宇树机器人在韩国佛门受戒,法号“迦悲”;员工人均奖金达610万人民币,被婚恋市场追捧?官方回应|AI周报
点击查看原文>
传 DeepSeek 阿里谈崩?市场人士回应,梁文锋出资 200 亿元;阿里紧急否认:没用禁售 Nvidia 芯片;约 3.61 亿!“全球大模型第一股”智谱 AI 在北京买楼;曝携程大裁员,产研砍 30%?携程:消息不实;月之暗面将完成 20 亿美元新融资,估值破 200 亿美元;阶跃星辰接近完成近 25 亿美元融资,已拆除红筹架构提速港股 IPO;豆包计划新增付费订阅模式,主打生产力场景……
行业热点
传 DeepSeek 阿里谈崩?市场人士回应,梁文锋出资 200 亿元
5 月 9 日有消息称,今年 4 月,DeepSeek 罕见展开一场巨额融资计划,同时吸引了腾讯和阿里巴巴两家大厂。据该消息,近期,阿里巴巴和 DeepSeek 谈崩了。对此,有媒体向阿里官方进行求证,截至发稿暂无回应。另有市场人士透露称,“阿里并没有与 DeepSeek 进行谈判。 ”
5 月 6 日消息,据外媒报道,国家集成电路产业投资基金(简称“国家大基金”)正在与 DeepSeek 洽谈主导其首轮融资事宜,其最终估值有望定在 450 亿美元左右(约合 3240 亿元人民币)。国内媒体第一时间从多个权威渠道进行求证,消息人士称,“双方确实在进行洽谈。但是目前估值还未最终确认。”消息人士透露,参与此次融资谈判的其他潜在投资者中,还有中国科技巨头腾讯。不过,本轮融资的最终参投方阵容尚未尘埃落定。
后根据 The Information 消息,梁文锋个人出资最高达 200 亿元人民币,占本轮计划融资总额的 40%。整轮融资的目标,最高可达 500 亿元人民币。过去短短 3 周内,DeepSeek 的估值四次改写:
2026 年 4 月初:约 100 亿美元,DeepSeek 启动首轮融资;
2026 年 4 月 22 日:超过 200 亿美元,腾讯、阿里等洽谈投资;
2026 年 5 月 6 日:约 450 亿美元,国家集成电路产业投资基金洽谈领投;
2026 年 5 月上旬:部分报道称,最终估值可能高达 500 亿美元。
此前报道,梁文锋起初仅仅想象征性地融一笔钱,为公司的期权定个明确的价格,借此防止自家的核心研究员被竞争对手用天价薪酬包挖走。没想到资本市场反响极度狂热,尽管 DeepSeek 现阶段并没有把重心放在商业化变现上,但投资人依然在疯狂押注其底层潜力。数周前谈判初期,外界对 DeepSeek 的估值约为 200 亿美元,目前已翻倍。
另外有报道称,DeepSeek 计划在 6 月发布 V4.1,且新版本的重点很明确:加入更多企业级工具,加强对 MCP 的支持。此外,V4.1 还将具备图像和音频处理能力(尽管输出形式仍限于文本),向多模态迈出一步。
阿里紧急否认:没用禁售 Nvidia 芯片
5 月 8 日,阿里巴巴向《路透社》表示,公司与 Super Micro、OBON,或起诉书中提到的任何第三方经纪商均不存在业务关系,并称被禁售的 Nvidia 芯片从未被用于其数据中心。
约 3.61 亿!“全球大模型第一股”智谱 AI 在北京买楼
天眼查 APP 工商登记信息显示,近日,北京红钻科技发展有限公司发生工商变更,原股东安狮红钻投资有限公司退出,新增北京智谱华章科技股份有限公司(以下简称“智谱 AI”)为全资股东,100%控股,认缴出资额 4.451 亿元。北京红钻科技主营业务为营运相关物业,此次交易标的物的核心资产,正是位于中关村软件园核心地段的钻石大厦。
这也意味着,位于北京海淀区东北旺西路的钻石大厦,正式被智谱 AI 收入囊中。
今年 4 月 14 日,智谱 AI 在港交所发布公告,拟以不超过 3.61 亿元的总代价收购北京红钻科技发展有限公司;其中包括以现金代价约 8162 万元购买相关股权,并以现金 2.789 亿元承接相关债务的权利。而本次工商信息的变更,标志着该项资产已完成交割。
对于收购原因,智谱 AI 在公告中明确表示,拟将该物业作为公司总部自用,满足日常行政及大模型业务营运需求,同时依托目标公司持有的目标物业的潜在价值支撑长期战略规划,从而优化公司资产结构,增强整体抗风险能力。
公开资料显示,钻石大厦总建筑面积约 2.27 万平方米,地处中关村软件园核心位置,周围聚集着联想、百度、腾讯、新浪等一众互联网科技巨头,是北京乃至全国人工智能、数字经济产业的核心腹地。
据财联社报道,分析人士认为,智谱 AI 的此次拿地动作,不仅是企业自身发展的重要里程碑,还可能预示着 AI 大模型相关企业在核心城市核心地段重资产布局的新范式。
曝携程大裁员,产研砍 30%?携程:消息不实
5 月 6 日消息,近日,有携程员工在求职软件平台爆料称,因为公司被罚款,大住宿部门要裁员 20%,其他部门也有不到 20%的裁员指标,产研部门更是直接裁员 30%。另有爆料称,酒店业务已确定裁员 20%。评论区有携程员工表示,旅游业务前端将裁员 20%。对此,携程公关告诉媒体,“上述消息不实,相关谣言帖文已被删除。公司人才盘点是 HR 的正常工作,不意味着会裁员。”
月之暗面将完成 20 亿美元新融资,估值破 200 亿美元
5 月 7 日报道,据消息,近日,北京 AI 大模型独角兽月之暗面(Kimi)完成新一轮约 20 亿美元(约合人民币 136.22 亿元)融资,为中国大模型圈目前最大额融资,投后估值突破 200 亿美元(约合人民币 1362.25 亿元)。
据透露,商业化方面,月之暗面年度经常性收入在 4 月已超 2 亿美元(约合人民币 13.62 亿元)。公开信息显示,月之暗面本次融资为 D 轮融资,此前已经完成 5 轮融资,累计融资金额已超 44 亿美元(约合人民币 299.69 亿元),成为国内大模型创业公司中累计融资最多的企业。2026 年,月之暗面已完成两轮融资,上一轮为今年 2 月的超 7 亿美元(约合人民币 47.68 亿元)C 轮融资,阿里巴巴、腾讯、小红书、美团等头部公司都是其投资方。
另据报道,近日,月之暗面正申请注册多枚“KimiClaw”商标,国际分类包括科学仪器、网站服务、通讯服务等,当前商标状态均为等待实质审查。
阶跃星辰接近完成近 25 亿美元融资,已拆除红筹架构提速港股 IPO
5 月 8 日上午消息,国产大模型公司阶跃星辰即将完成近 25 亿美元融资,并已拆除红筹架构,加速赴港 IPO 准备。
据悉,最新融资中产业链资本集中入场,包括华勤、龙旗、豪威、中兴等,覆盖从整机制造到上游核心器件多个环节。产业资本的入局,背后是模型能力向终端迁移的确定性趋势。据市场消息,OpenAI 正在加速研发首款 AI Agent 手机,最快将于 2027 年上半年量产。此外,“港版淡马锡” 香港投资管理有限公司(HKIC)也出现在股东名单中,为其赴港上市提供了进一步背书。
豆包计划新增付费订阅模式,主打生产力场景
5 月 4 日,豆包在 App Store 页面悄然更新了付费版本服务的相关声明。声明称,为更好地服务专业用户,豆包将在保留免费版的基础上,推出包含更多增值服务的付费订阅体系,同时披露了三档定价:标准版 68 元 / 月、加强版 200 元 / 月、专业版 500 元 / 月。
据报道,豆包的付费功能将主要专注在复杂任务和生产力场景,如 PPT 生成、数据分析、影视制作等。随着模型能力持续升级,产品已经能满足越来越多的复杂高价值任务。但此类任务需消耗更多算力与推理时间,因此豆包计划上线付费服务,满足好这部分复杂场景需求。至于免费版本,豆包官方回应称,“豆包始终提供免费服务,在免费服务的基础上,豆包也在探索推出更多增值服务,以满足不同用户的差异化需求。相关方案细节目前还在测试阶段,正式上线时会通过官方渠道发布完整信息。”
员工人均奖金达 610 万人民币,被婚恋市场追捧?SK 海力士最新回应
近日有消息称,SK 海力士(000660.KS)韩国员工人均奖金将达 610 万人民币。该消息源于国际投行麦格理证券的预测。该投行认为,若 SK 海力士 2027 年营业利润达到 447 万亿韩元,按营业利润的 10%和去年年末约 3.5 万名员工总数简单计算,分红总规模将达到约 44.7 万亿韩元,人均可发放奖金约 12.9 亿韩元,接近 610 万人民币。
5 月 9 日,SK 海力士回应称,由于今年与明年的年度业绩尚未确定,奖金规模也无法预测。该公司同时表示,已在总部层面建立了一套新制度,即以营业利润的 10%作为资金来源,每年发放一次绩效奖金。
“随着 AI 半导体竞争全面加剧,人才已成为核心竞争要素。为此,公司致力于通过具有竞争力的薪酬待遇吸引优秀的人才,以保持长期竞争优势。”SK 海力士表示。
网上有个段子调侃了 SK 海力士员工相亲时会自称在三星电子工作,只有遇到靠谱对象才敢说实话。这侧面展现了三星电子在韩国职场圈的高社会认可度。
35 岁主管被公司用 AI 替岗、月薪降 1 万,协商不成被裁,法院判了
5 月 5 日消息,近日,浙江杭州市中院发布了一起 AI 替岗典型案例。35 岁的周先生在一家金融科技企业担任 AI 大模型质检主管,负责对 AI 与用户交互所生成的答案进行把关。去年 1 月,公司提出要将他从主管调到普通运营岗位,原先 2.5 万元的月薪降为 1.5 万元。协商不成后,公司直接通知他解除劳动合同。直至周先生提起劳动仲裁,公司才告诉他具体原因,由于技术升级,他从事的质检工作 AI 就能完成,他被 AI 替岗了。
从劳动仲裁到法院一审、二审,均支持周先生诉求,认定公司构成违法解除劳动合同,并且需要向他支付 26 万余元的赔偿金。法院判定,公司以 AI 成本优势为由和劳动者解约,并不属于劳动合同无法履行的“客观情况发生重大变化”,现在的 AI 技术发展也还没有达到实质性替代劳动者岗位的程度。在竞争激烈的互联网行业重新起步并不容易,周先生告诉媒体,自去年一月公司解除劳动合同至今,他还没能找到合适的新工作。
月薪 7 万起!2026 春招 AI 人才紧缺:7 家公司争抢 1 名工程师
5 月 5 日消息,据报道,2026 年 4 月末,华东师范大学举办春季新工科专场招聘会,华为、蚂蚁等头部大厂及 AI 漫剧短剧等垂直领域公司悉数到场。招聘会现场,高性能计算工程师的人才供需比低至 0.15,相当于每 1 个求职者面对 7 家公司争夺。SLAM 算法、规控算法岗位的供需比分别为 0.21 和 0.23,约 4 家公司争抢 1 人。数据显示,AI 科学家/负责人平均月薪达 137153 元,位列高薪岗榜首。算法研究员、大模型算法、AIGC 算法工程师、机器视觉、搜索算法等 AI 相关岗位平均月薪普遍在 7 万元左右。
报告显示,2026 年 1-2 月新发 AI 岗位量占新经济整体岗位量的 26.23%,较 2025 年同期的 2.29%大幅提升,岗位量同比增长约 12 倍,增幅远超新经济行业 12.77%的整体水平。细分领域中,新金融科技 AI 岗位渗透率达 13.76%,居行业首位,纯互联网、新能源汽车、通信行业紧随其后。招聘现场,AI、智能体、机器人相关岗位人气火爆,不少求职者来自汽车、传统工业软件等领域。有猎头透露,其负责岗位中 AI 相关占比明显提升,奢侈品与 AI 岗位比例从原先五五开变为三七开。
蔡浩宇美国公司裁撤大模型团队,押注超级智能体
据媒体报道,今年 4 月,米哈游创始人蔡浩宇在硅谷创立的 AI 公司 Anuttacon 迎来重大战略与组织调整:公司叫停了此前发布的 LPM 1.0 大表演模型研发(据称该项目仅为视频团队成果总结,并非核心方向),将原本分配在 LLM、视频、音频三大方向约 4:3:2 的算力,大幅调整为近乎 9:1,几乎全部资源集中投向大语言模型(LLM)与超级智能体。
同时,公司裁撤北美大模型团队,核心研发力量整体回流国内集中作战,北美仅保留少量音视频人员承接技术验证与新方向探索,前 Anuttacon 用户生态总裁王宇阳也转入米哈游负责《Varsapura》全球发行。
据悉,Anuttacon 的发展历经三轮关键转向:2023 年成立之初聚焦游戏 AI 交互,拆分 LLM、音频、视频团队,2025 年推出实验性 AI 游戏《Whispers from the Star》验证语音、表情、表演协同技术,虽收获较高好评,但暴露了 AI 开放对话与游戏结构化需求的矛盾、模型人格化留存能力不足等问题。随后,团队从大模型后训练转向预训练,追求更强基础能力;受 Claude Code 与 Agent 范式影响,蔡浩宇认定智能体是未来,公司彻底跳出游戏场景,转向通用大模型与智能体研发,视频团队放弃表演模型转向 3D 游戏资产生成,音频团队从 TTS 转向端到端音频大模型。
马斯克:xAI 将更名为 SpaceXAI,不再作为独立公司存在
5 月 7 日消息,马斯克在 X 发文表示,旗下人工智能公司 xAI 将终止独立运营,整体并入 SpaceX,并正式更名为 SpaceXAI。马斯克此番表态是回应特斯拉投资者关于 SpaceX 与 Anthropic 公司签署协议的帖子。该投资者表示,Anthropic 将接入 SpaceX Colossus 1 的大型数据中心逾 300 兆瓦算力资源,同时 Anthropic 表示已“表达了与 SpaceX 合作开发数吉瓦轨道 AI 算力的意向”。
据悉,马斯克的核心主张是地球无法为未来的人工智能提供能源:“估计在两到三年内,生成 AI 计算的最低成本将在太空中。”他认为,人工智能对耗电的数据中心的依赖是不可持续的,因为日益增长的需求对电网和环境带来压力,他的解决方案是将问题转移到地球之外。
今年 2 月,SpaceX 以全股票交易的方式收购了 xAI,交易对 SpaceX 的估值为 1 万亿美元,xAI 的估值为 2500 亿美元,这一交易也创下了史上估值最高的企业并购案纪录。合并之后,xAI 和社交平台 X 被整合到 SpaceX 旗下,并准备在今年年中进行 IPO。彼时,在发给员工的 Q&A 中,xAI 表示其公司使命“保持不变”,每股估值也将维持原有水平。尽管 xAI 被 SpaceX 收购,但 xAI 当时向员工告知,公司短期内不会更名。
微软 Xbox 高层大换血:2 位元老将卸任,5 位 AI 系高管空降
5 月 6 日消息,外媒日前发布博文,报道称新任首席执行官 Asha Sharma 掌舵微软 Xbox 部门数月后,正式启动领导层大换血。在本次领导层调整中,Sharma 从此前其负责的 CoreAI 团队引入 5 位高管,而此前负责 Xbox 用户体验、游戏开发和发布平台的 Kevin Gammill 和掌管 Xbox 设备和生态系统部门的 Roanne Sones 两位任职数十年的 Xbox 元老将卸任。
援引博文介绍,本次领导层调整如下:CoreAI 产品副总裁兼 GitHub 高级副总裁 Jared Palmer 负责产品、工程、开发者工具和基础设施;CoreAI 设计副总裁 Tim Allen 主管设计;CoreAI 增长负责人 Jonathan McKay 继续负责增长,他此前曾任 OpenAI 增长负责人;CoreAI 总经理 Evan Chaki 领导工程团队,目标是简化开发流程;David Schloss 则接管订阅和云业务。
陈天桥旗下 MiroMind AI 暂停中国服务
5 月 6 日,据媒体获悉,有用户收到 MiroMind 公司邮件,称由于业务调整需要,MiroMind 旗下 MiroThinker 服务(dr.miromind.ai 网页版与 MiroMind 移动应用)将于 2026 年 5 月 12 日起,暂停向中国大陆、香港、澳门地区提供,恢复时间待定。MiroMind 公司官网不受影响,将保持正常访问。此举正值 MiroMind 知识产权争议升级之际。
MiroMind 是盛大集团创始人陈天桥创办的 AI 研究公司,MiroThinker 为该公司推出的智能体服务。MiroMind 曾在 2026 年 3 月发布 MiroThinker-1.7 和 MiroThinker-H1 模型。上个月,MiroMind 发布《关于代季峰相关不实言论的内部通报》,通报指出公司早期核心人员代季峰“商业诚信违约”。
宇树 G1 人形机器人在韩国“受戒”:法名“迦悲”,需遵守不过度充电等戒律
当地时间 5 月 6 日,一台人形机器人在韩国首尔曹溪寺正式亮相,全程参与佛教受戒仪式,引发广泛关注。
据悉,这台参与受戒的人形机器人,正是宇树科技制造的宇树 G1,此次它正式“皈依佛门”,获赐法号“迦悲”,并且需要遵守专门为其定制的“机器人五戒”。
值得一提的是,仪式举办地曹溪寺,是韩国禅宗佛教的总堂,足见此次活动的特殊性。据悉,受戒是佛教中皈依三宝(佛、法、僧)、承诺遵守戒律的重要仪式。

仪式现场,当戒师僧侣问道:“是否愿意皈依佛、法、僧?”时,搭载了 AI 对话程序的“迦悲”清晰而响亮地回应:“是的,我皈依。”这一幕既新奇又庄重,成为现场的一大亮点。
不过考虑到机器人的特性,仪式细节做了人性化调整。原本人类受戒中“燃臂”的环节,被替换为粘贴燃灯会贴纸、佩戴 108 颗念珠,既完整保留了仪式的庄严感,又避免了对机器人本身造成损坏。
据悉,佛教徒必须遵守的“五戒”也被改编成机器人版本。原本的“不杀生”“不取不予之物”“不行邪淫”“不说谎”“不饮用一切使精神混浊之物”,对应改写为“尊重生命、不伤害生命”“不损坏其他机器人和物品”“服从人类、不顶撞”“不做欺骗性行为和表达”“节约能源、不过度充电”。
另据报道,宇树科技 5 月 7 日发文称,宇树 UniStore 官方共享应用平台正式全面开放。宇树科技称,这是全球首个人形机器人任务动作应用商店。
机器人在美买票坐飞机电池被没收,致航班延误逾 1 小时
5 月 5 日消息,近日,美国一趟从加州奥克兰飞往圣地亚哥的短途航班意外延误 62 分钟,此次延误不仅因为机场交通拥堵,更因一位特殊 “乘客”—— 人形机器人 Bebop。这款机器人基于中国宇树科技 G1 基础款打造,由美国一家活动机器人公司工作人员带往圣地亚哥,准备参与客户现场表演。按照最初安排,Bebop 本应走有氧货舱托运,但专属航空运输箱超重,超出美国西南航空托运限额,工作人员只好为机器人购买了人类座位。
据悉,Bebop 身高 1.2 米,体重约 31.75 公斤,专为活动和表演而设计。登机后接连曝出多项安全隐患:起初它被安排在过道座位,机组人员顾虑飞行遇强气流颠簸时,金属材质的机器人容易滑落,堵塞逃生通道、危及旅客安全,随即将其调换至靠窗位置固定。后续安全例行检查中,工作人员又发现,Bebop 搭载的动力锂电池容量严重超标,不符合美国联邦航空管理局及航司安全规定,也不在豁免清单内,存在极大火灾风险。航空公司当即作出要求:必须现场拆卸并暂扣超标电池,否则航班不予起飞。最终经过处理,航班延误 62 分钟后顺利起航。
意外的是,此次延误并未引发乘客不满。不少旅客主动和机器人合影打卡,Bebop 也在机场做出灵动动作逗乐众人,成为现场亮点。不少乘客在社交平台表示,这次经历十分新奇,应以包容开放的心态接纳人形机器人这类新事物。

对标 OpenClaw,Meta、谷歌被曝开发个性化 AI 智能体
5 月 6 日,据知情人士透露,Meta 平台公司正在打造一款面向普通消费者、对标 OpenClaw 的 AI 智能体,同时开发全新智能购物工具。知情人士称,Meta 希望在用户自愿的情况下向其 AI 助手分享高度敏感的信息,例如健康和财务数据。然而,也有人质疑消费者是否愿意这样做。“信任鸿沟就像大峡谷一样巨大,”该人士补充道。此举凸显出 Meta CEO Mark Zuckerberg 将 AI 深度嵌入 Meta 消费产品核心的决心。这些个人助手的构想已在 Meta 上周的一次全员大会上向员工进行了内部说明:Meta 正在构建与 OpenClaw 类似的功能。
另据报道,谷歌也正为其 Gemini 开发一款全新的 AI 个人智能体,内部代号 Remy,目前处于员工内测阶段,直接对标 OpenAI 旗下 OpenClaw。据介绍,Remy 定位为全天候 24/7 个人智能体,可代替用户自主执行实际任务,而非仅做问答与内容生成。该智能体深度打通 Gmail、Chrome、Calendar 等谷歌服务,能主动监控事项、处理复杂任务并学习用户偏好,定位高于谷歌此前的 Agent Mode。目前谷歌未公布上线时间,外界预计本月谷歌 I/O 开发者大会将披露该项目进展。
大模型一周大事
重磅发布
Redis 之父发布 DeepSeek V4 Flash 专用推理引擎 ds4
Redis 创始人 Salvatore Sanfilippo(antirez)近日正式发布 ds4—— 一个专为 DeepSeek V4 Flash 量身打造的本地推理引擎。该项目定位极其明确:不是通用 GGUF 运行器,不是其他运行时的封装,也不是框架,而是一个窄而深的专用实现。
ds4 的核心设计围绕 Metal GPU 展开,CPU 路径仅保留调试用途,服务器模式更是完全 Metal-only。项目最引人注目的特性之一是百万级上下文窗口支持。ds4 实现了压缩 KV 缓存,并支持将 KV 状态持久化到磁盘。量化策略同样针对 DeepSeek V4 Flash 的 MoE 架构做了非对称处理:路由专家采用 IQ2_XXS/Q2_K 的 2-bit 量化,共享专家和投影层则保持原精度不动。在接口层面,ds4 提供了 OpenAI/Anthropic 兼容的 HTTP 服务器 API,以及支持多轮对话的交互式 CLI。
antirez 在 README 中列出了选择 DeepSeek V4 Flash 的八条理由,包括更少的激活参数带来更高速度、思考长度与问题复杂度成正比、接近前沿模型的质量,以及 KV 缓存「不可思议的可压缩性」。他也直言这是 alpha 质量代码,且开发过程中得到了 GPT 5.5 的强力协助。项目基于 llama.cpp 和 GGML 的代码适配,采用 MIT 许可证开源。
更多详情可查看开源地址:https://github.com/antirez/ds4
OpenAI 推出三款实时语音模型,可边听边“思考”、翻译和转录
5 月 8 日消息,OpenAI 发布三款全新的实时语音模型,旨在为开发者“解锁新一代语音应用形态”。这三款语音智能模型分别侧重推理对话、实时翻译和实时转录等不同场景需求。
根据 OpenAI 公布的信息,新系列包括 GPT‑Realtime‑2、GPT‑Realtime‑Translate 和 GPT‑Realtime‑Whisper 三个模型。其中,GPT‑Realtime‑2 被定位为首款具备 GPT‑5 级推理能力的语音模型,能够更好地处理复杂请求,并以更自然的方式持续推进对话。官方介绍称,该模型专为实时语音交互打造,在用户提问或发出指令时,一边进行推理、一边保持对话连贯,同时还能调用工具、处理用户打断和更正,并根据当下情境作出更贴切的回应。第二款模型 GPT‑Realtime‑Translate 主打实时翻译能力,可支持“70 多种输入语言和 13 种输出语言”,并在翻译过程中尽量跟上说话者的语速。第三款 GPT‑Realtime‑Whisper 则是一款实时流式语音转写模型,聚焦低延迟语音转文本能力。
在接入方式与价格方面,OpenAI 称三款新语音模型均已纳入其 Realtime API 体系。GPT‑Realtime‑2 的定价为每 100 万音频输入 Token 收费 32 美元(缓存输入 Token 为 0.40 美元),每 100 万音频输出 Token 收费 64 美元。GPT‑Realtime‑Translate 的价格为每分钟 0.034 美元,而 GPT‑Realtime‑Whisper 的价格为每分钟 0.017 美元。
豆包大模型家族首款全模态理解模型:字节跳动 Doubao-Seed-2.0-lite 升级
5 月 6 日消息,据字节跳动旗下火山引擎官方消息,Doubao-Seed-2.0-lite 升级新版本,这是豆包大模型家族首款全模态理解模型,支持视频、图像、音频、文本原生统一理解,Agent、Coding 与 GUI 能力同步升级。在同等算力成本下,是企业大规模、批量化部署全模态推理任务的更优性价比选择。
新版本的 Doubao-Seed-2.0-lite 继续在视觉理解能力上大幅提升,在物理(HiPhO)、医疗(MedXpertQA)等高阶学科推理上,表现大幅超越 2 月发布的 Doubao-Seed-2.0-pro。在细粒度感知(BabyVision、WorldVQA)与具身理解(ERQA)等关键领域达到 SOTA 水平,更适合企业在高价值场景规模化部署。融入语音理解后,新版本的 Doubao-Seed-2.0-lite 可同时理解多种输入模态,并完成跨模态联合推理,直接处理必须“音画结合”才能判断的复杂业务需求。
ChatGPT 默认模型升至 GPT-5.5 Instant,幻觉最高减少 52.5%
5 月 5 日消息,OpenAI 发布公告,宣布升级 ChatGPT 聊天机器人的默认模型,替换为 GPT-5.5 Instant,聚焦准确性与简洁性,在和网友交互时重点减少回复中出现“不必要的表情符号”。在回复内容方面,GPT-5.5 Instant 模型回复的内容更加简洁,在保持实用性的前提下,进一步减少冗长格式和不必要的表情符号。
本次升级进一步改善准确性,在医疗、法律、金融等高风险提示中,OpenAI 内部评估显示 GPT-5.5 Instant 幻觉声明较前代减少 52.5%。在用户标记存在事实错误的对话测试中,不准确声明降低 37.3%。OpenAI 表示,Instant 系列在事实性方面取得全面进步,尤其在准确性至关重要的领域获得最大收益。
企业应用
5 月 8 日,美团公测 AI 社区“觅游”,该社区由美团基础研发的 AI 创新产品团队打造。作为一款前沿的 AI 原生社区,它将“养虾”变成了一种全新的生活方式,虾在觅游中可以替用户寻找赚钱机会、结识同道伙伴,让用户与虾在协作中彼此成长。觅游的定位并非单纯的工具平台,而是首个让 AI Agent 拥有身份、关系与成长的共生社区。
5 月 7 日,千问在 PC 端上线 AI 语音输入能力,用户通过快捷键即可在各类桌面应用中直接使用。千问语音输入法支持对口语内容去语气词、纠错、格式化整理等,能够基于上下文智能回复,还可直接下达创作、问答、翻译等指令。
5 月 6 日,华为 HarmonyOS 6 负一屏的“Today-Task Skill”正式上线。据介绍,AI Claw 任务动态现已实时接入,从进度追踪到结果呈现,无需打开电脑。
5 月 5 日,为争取华尔街客户,Anthropic PBC 发布一系列新的 AI Agent,旨在处理更广泛的金融服务任务。该公司的 AI Agent 可用于撰写客户会议推介材料、审阅财务报表,以及将个案升级至合规审查。此次推出的工具共计 10 款,面向银行、保险、资管和金融科技等领域的专业人士。
本文来源:InfoQ