AI Agent 的记忆中间件:火山 Mem0 架构拆解及落地实践|QCon北京

点击查看原文>

从「AI For What」到「Value From AI」,100+可落地实践案例打通 AI 实战最后一公里!

4 月 16 日-4 月 18 日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦 Agentic AI、多智能体协作、算力优化、技术债治理、多模态和 AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。

字节跳动高级技术专家季旭博士已确认出席 “Agent Infra 架构设计” 专题,并发表题为AI Agent 的记忆中间件:火山 Mem0 架构拆解及落地实践的主题分享。火山托管 Mem0 (Managed Mem0) 是一个为 AI Agent 和智能应用设计的专用记忆中间件。它以开源 mem0 为基础,通过全托管、多租户、高可用的 PaaS 服务,解决了在生产环境中构建和维护 AI 长期记忆的复杂性。其核心价值在于提供了一个强化 GraphRAG 能力的统一记忆层,使 AI Agent 能够超越短期上下文窗口的限制,形成对用户、实体及其关系的深刻、持久的理解,从而交付更加个性化、智能和连贯的交互体验。

本次演讲季旭博士将重点介绍在字节跳动内使用 mem0 来支持 AI Agent 的产品的一些经验和实际落地的案例,包括字节跳动 AI Agent 的痛点与需求,针对这些痛点和需求,火山记忆库 mem0 所做出来的针对性技术方案以及成功的落地案例,最后是他们对未来 AI Agent 的技术判断,希望能给听众带来一些帮助和思考。

季旭博士,2019 年博士毕业于清华计算机系。研究领域为 AI 的记忆系统,高性能文件系统,AI 推理的基础设施 KVcache,高性能 KV 数据库等。在 FAST,NSDI,SC 等会议发表多篇论文,申请发明专利多项。曾就职于商汤和阿里巴巴,现担任字节跳动高级技术专家。多年来专注于 AI Infra 的构建和实现,构建了和火山 mem0 记忆系统和开源 KVcache 系统 PrisKV,服务于字节内部多个 AI 业务,目前深耕于 AI 记忆系统,在大规模并行文件系统、KV 数据库,Skills、Context Engineering、向量数据库、KVcache 构建等领域拥有丰富实践经验。他在本次会议的详细演讲内容如下:

演讲提纲

1. AI Agent 的痛点与需求

  • 记忆的实现与维护复杂:从底层的向量数据库、图数据库选型,到上层的实体关系抽取、多模态内容理解,再到服务自身的弹性伸缩与可观测性,自建一套生产级记忆系统的技术栈复杂、成本高昂

  • 上下文窗口的局限:大语言模型(LLM)的上下文窗口虽然不断扩大,但依然有限且成本高昂。对于需要长期跟踪用户偏好、历史互动和领域知识的场景,简单的上下文填充方案难以为继

  • 浅层语义检索的瓶颈:传统的向量检索(Vector Search)虽然能找到语义相似的文本片段,但难以捕捉和利用实体之间复杂的、隐含的关系,导致 AI 的“思考”缺乏深度和逻辑关联

2. 火山记忆库 mem0 技术方案

  • graphmemory

  • Short-term memory

  • Context graph

3. 火山 mem0 的落地案例

  • 智能客服

  • AI 导购

  • 研发提效

  • 运维数字机器人

4. 未来展望

  • 工程实践经验总结

  • memory 面向 Agent 时代的演进方向

您认为,这样的技术在实践过程中有哪些痛点?

  • 成本与延迟权衡:抽取、向量化、图写入和检索叠加开销,需要通过异步化、限流和策略分层平衡体验与成本

  • 多租户隔离:跨会话、跨租户的租户隔离

  • 双通道可观测性:向量检索和图检索并存时,故障定位和容量规划更复杂,需要统一指标和链路追踪

  • 记忆效果的提升和评测:缺少领域内特定的 Benchmark,Locomo 评估的体系过于静态

演讲亮点

  • 托管化记忆层:提供开箱即用的 API Key 鉴权、限流、异步任务和指标,几行代码即可接入,降低自建成本

  • GraphRAG 工程落地:给出实体和关系抽取、相似度合并、图与向量融合检索和 BM25 重排的可复制方案

  • 典型场景:覆盖客服、导购、研发和运维场景,总结闭环效果和关键踩坑

听众收益

  • 即插即用的接入路径:通过托管 Mem0 的接口快速接入,减少对现有系统的改造。

  • 火山 AI 生态的落地经验:真实的工程实践经验,避免走工程上的弯路

  • 图谱构建与最佳实践:掌握抽取、合并、删除和检索融合的关键参数与实操技巧,构建最佳的记忆效果实践

  • Agent 领域的演进思考:面向 OpenClaw 等最新 Agent 范式 memory 的演进规划和思考- 托管化记忆层:提供开箱即用的 API Key 鉴权、限流、异步任务和指标,几行代码即可接入,降低自建成本

  • GraphRAG 工程落地:给出实体和关系抽取、相似度合并、图与向量融合检索和 BM25 重排的可复制方案。

  • 典型场景:覆盖客服、导购、研发和运维场景,总结闭环效果和关键踩坑

除此之外,本次大会还策划了Agentic Engineering多模态理解与生成的突破记忆觉醒:智能体记忆系统的范式重塑与产业落地具身智能与物理世界交互Agent Infra 架构设计AI 重塑数据生产与消费AI 原生基础设施AI 驱动的技术债治理小模型与领域适配模型大模型算力优化Agent 可观测性与评估工程AI for SRE等 20 多个专题论坛,届时将有来自不同行业、不同领域、不同企业的 100+资深专家在 QCon 北京站现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 18514549229 进行咨询。


本文来源:InfoQ