初级
Claude 让智能体记忆成为现实,但语义与本体论仍付之阙如
Claude 让智能体记忆成为现实,但语义与本体论仍付之阙如
Claude 最新发布的托管智能体(Managed Agents)公告,为企业 AI 的发展方向提供了一个有用的标志。Anthropic 将"梦境"(dreaming)描述为一个定时运行的过程,它会审查智能体会话和记忆存储,提取模式,并整理记忆,从而使智能体随时间不断改进;同一版本还引入了成果(outcomes)和多智能体编排(multiagent orchestration)功能(Claude 博客)。Anthropic 的记忆文档将记忆存储描述为工作区范围内的文本文档集合,可以附加到托管智能体会话中,挂载到会话容器下的
/mnt/memory/ 目录,智能体可以使用与其他地方相同的文件工具进行读写(Claude API 文档)。Anthropic 的记忆发布文章还指出,这些记忆是基于文件的、可导出的、可通过 API 管理的,并且内置了作用域权限、审计日志以及回滚/版本控制功能(Claude 博客)。这完全是一个正确的方向。智能体需要能够被检查、编辑、跨会话携带并在边界内共享的记忆。基于文件的记忆存储尤其有趣,因为它将记忆视为智能体工作环境的一部分,而不是一个附加在侧面的黑盒检索服务。
但是,一个可以记住的地方,并不等同于能够理解的记忆。一堆笔记只是存储。有用的记忆需要语义和本体论。语义告诉系统某物是什么。本体论告诉系统从特定视角来看,它为什么重要。
以一块石头为例。从语义上讲,它是一块石头:形状、重量、材质、位置、纹理。但对于一个疲惫的徒步者来说,它是一把椅子。对于雕塑家来说,它是原材料。对于地质学家来说,它是证据。对于施工队来说,它是一个障碍物。同一个物体。相同的事实。不同的视角。不同的含义。
个人记忆处处都有这个问题。"下周给 Ravi 打电话"这个提醒,除非系统知道 Ravi 对你意味着什么,否则毫无用处。Ravi 是投资人、朋友、学生、客户、医生,还是联合创始人?这个提醒在每种情况下都有相同的文字,但记忆应该根据关系不同而表现出不同的行为。
这就是个人记忆困难的原因。一个人的本体论是流动的,因为我们同时扮演着多重身份。我们是父母、朋友、同事、病人、客户、经理、学生和创始人,往往在同一天内切换。同一个事物会随着人的角色转变而改变含义。
组织则不同。它们仍然存在政治、模糊性和相互竞争的激励因素,但它们也有角色:销售、财务、法务、支持、工程、采购、运营、领导层。角色为组织记忆提供了更稳定的本体论。
一封供应商延迟邮件具有一种语义结构:供应商、采购订单、延迟项目、原定日期、修订日期、原因。对采购部门来说,这是供应商风险。对财务部门来说,这是应计问题。对运营部门来说,这是生产延迟。对法务部门来说,这可能是合同风险。
同一个文件。相同的语义事实。不同的本体论。
这就是我想就 Company Brain 表达的观点。Claude 为智能体提供了一个可以记住的地方。Sentra 的赌注是,公司记忆也需要结构:文件作为来源,语义作为提取,本体论作为视角,以及一个带权限的记忆图作为智能体可以使用的底层基础。
企业 AI 的下一个篇章不会是一个无所不知的助手。它将是一个能够记住足够多信息的公司,让人类和智能体能够从相同的现实出发采取行动,而不必强迫每个人都以相同的方式看待这个现实。
在第 5 部分中,我论证了记忆必须成为共享的语义状态,而不是单个工具内部的一个功能。那个论证是关于底层基础的。这篇文章是关于底层基础之上的东西,因为仅靠底层基础本身并不能创造采用。创造采用的是透镜层。
目前主流的企业 AI 策略仍然是每家公司一个助手,采用一种公司范围内的模型来理解工作如何组合在一起。即使公司在这个方向上投入巨资,采用率仍然参差不齐。销售用一种方式使用它,产品用另一种方式,支持几乎不用,法务几乎从不使用,而领导层则把它变成一个搜索框。界面看起来是统一的,但使用方式却不是。
原因在于,这个助手隐含着携带单一本体论。单一本体论无法适应七个不同职能部门实际看待自己工作的方式。
自定义本体论才是实现组织范围内 AI 采用的真实路径。采用率并不是通过给每个员工提供相同的助手并希望他们能很好地提示它来优化的。这仍然要求人们将自己的工作翻译成 AI 的界面。更好的方向是反过来:AI 应该理解公司每个部门已经如何看待自己的工作。
销售以客户、利益相关者、异议、续约风险、采购委员会和承诺来思考。产品以信号、路线图权衡、发布阻碍、回归问题、功能请求和客户痛点来思考。支持以严重程度、复发率、解决方案、客户影响、升级和解决路径来思考。法务以义务、审批、风险敞口、红线条款和承诺来思考。领导层以战略、偏离、执行差距、所有权和公司状态来思考。
这些不是不同的公司。它们是同一家公司理解相同工作的不同方式。
架构上的举措是将底层基础与透镜分开。底层基础是共享的、带权限的、可检查的和持久的。透镜是功能性的、可定制的、按垂直领域划分的。公司定义其运作方式的广义本体论,每个职能部门定义其如何看待自身职责范围的狭义本体论。底层基础在底层持有相同的记忆。透镜决定该记忆在上下文中意味着什么。
这也是为什么基于文件的记忆是一个如此有趣的起点,但并非终点。在 Claude 的托管智能体系统中,记忆存储可以在会话创建时附加,当记忆的不同部分有不同的所有者或访问规则时,可以附加多个存储(Claude API 文档)。这自然地映射到企业问题上,因为记忆没有一个单一的所有者。有些记忆属于用户,有些属于项目,有些属于职能部门,有些属于公司。
更困难的问题是这些记忆如何变得有意义。如果一个客户问题在一次会议中被讨论,再次出现在 Slack 线程中,变成一个支持工单,引发销售担忧,后来又改变了路线图优先级,这些不应该变成五个不相关的记忆。它们应该变成一个不断演变的记忆,带有不同的轨迹:支持轨迹、客户轨迹、产品轨迹、收入轨迹、行动轨迹和决策轨迹。每个轨迹之所以存在,是因为某个本体论决定了什么重要。
当这变得成熟时,与 AI 的界面也会改变。目前工作中的大多数 AI 仍然是反应式的。你打开一个聊天框,问一个问题,粘贴上下文,等待答案,然后去做工作。即使答案很好,你仍然需要承担知道问什么、上下文在哪里以及接下来应该发生什么的责任。
成熟的公司记忆颠覆了这种模式。系统已经知道会议、消息、邮件、工单、工作流和行动中发生了什么。它知道通常对你的角色来说什么重要,哪个本体论适用,哪些条件发生了变化,以及哪些行动可能可用。因此,它可以把工作带到你面前,而不是等着你去找它。
这是我最关心的产品转变:AI 带来上下文,人类做出决策,智能体完成任务。这听起来简单,但它改变了谁承担上下文负担的问题。
一位经理开始新的一天,看到上周会议上做出的一个客户承诺从未变成工作。系统不会等着经理去搜索。它会说明发生了什么、来自哪里、涉及谁、为什么重要以及有哪些行动可用。经理在三十秒内做出决策。如果没有底层基础,这个承诺会在两个月后由一位愤怒的客户提出时才被曝光。
一位 CEO 看到一项战略举措正在偏离轨道,因为领导层会议中的决策与运营团队正在创建的工作不匹配。这是仪表盘通常会遗漏的那种事情,因为仪表盘在事后才看到指标。公司记忆可以更早地发现差距,因为它记得承诺、理由、交接以及随后发生或未能发生的行动。CEO 不需要一份新报告。CEO 需要在差距出现的那一刻就将其曝光。
一个处理支持升级的智能体需要的不仅仅是最新的工单。它应该知道同一个问题出现在客户通话中,销售承诺了一个变通方案,产品降低了修复的优先级,并且客户即将续约。相同的记忆看起来不同,取决于智能体是在为支持团队做简报、准备客户经理,还是警告产品部门关于路线图的风险。
主动式 AI 需要边界,因为它越有用,这些边界就越重要。本体论决定什么重要。权限决定谁能看到它。来源显示它来自哪里。行动记忆显示已经做了什么。人类批准有意义的决策。智能体在护栏内执行。
没有这些边界,主动式 AI 就会变成噪音或监视。有了这些边界,它就成为公司从共享现实中采取行动的一种方式。
以下是我下的赌注,具体到足以被证明是错的。在十八个月内,那些构建了共享语义状态的公司与那些将智能体嫁接到碎片化数据上的公司之间的差距,将以一种特定的方式变得可衡量。它不会出现在 AI 使用指标上,因为两组都会有很高的使用率。它会出现在决策转化为行动的速度上。
第一组将弥合会议与工作、承诺与跟进、战略与执行之间的鸿沟。第二组将继续产生无法累积的活动。要关注的指标不是人们使用 AI 的频率。而是公司成功完成它决定要做的事情的频率。
这就是成熟的公司记忆所能实现的。交互中有用的部分变成记忆。记忆变成公司运作方式的模型。模型将下一个重要的事情带给能够采取行动的人。随着轨迹的积累,系统会学习哪些信号重要,哪些行动有效,哪些承诺容易滑落,哪些交接失败,以及哪些决策会产生下游后果。公司开始从自身学习。
Claude 的记忆公告之所以重要,是因为它让持久的智能体记忆感觉像基础设施,而不是产品噱头。一个挂载到智能体文件系统中的记忆存储是一个很好的原语。但企业记忆不能止步于笔记。笔记必须变成语义对象。语义对象必须变成轨迹。轨迹必须通过正确的本体论来解释。本体论必须尊重角色、权限边界和行动面。
事实记忆告诉公司存在什么以及发生了什么。交互记忆保留了事情发生的原因以及人们是如何推理的。行动记忆记住了什么被做了、何时做的以及由谁做的。语义底层基础将它们整合在一起。本体论决定不同的人和智能体应该如何理解它们。
最终状态不是一个无所不知的 AI。而是共享的公司记忆:一个现实,多个透镜,人类和智能体从相同的状态出发采取行动。
这就是赌注。一个底层基础,多个透镜,能够累积的工作。我们正在构建的东西不是一个更聪明的助手。而是一个能够记住自己的公司。
在 Sentra,我们正在构建一个只能被描述为"公司大脑"的东西——一个共享的智能/记忆层,它位于所有沟通渠道、知识库、行动和智能体轨迹之上,以理解组织中每个人实际的工作方式以及工作是如何实际完成的,近乎实时地构建整个公司的活体世界模型。