上下文管理是对话式 AI 的记忆中枢,需通过技术方案(RAG、结构化记忆)与优化策略 (意图过滤、动态裁剪)解决连贯性、资源消耗与准确性的三角平衡问题。
声网对话式 AI 引擎采用的方案是通过结构化短期记忆+动态长期记忆注入,在保障兼容性的同时,针对实时语音交互场景(尤其中断处理)进行深度优化,并赋予开发者高度灵 活的上下文控制权限。
短期记忆(Short-term Memory)是智能体在当前会话中临时保存和处理的信息空间。 用户和对话式智能体互动期间,智能体会在短期记忆中缓存当前对话的上下文,确保智能体 能够连贯地理解和回应用户的连续输入。
对话式 AI 引擎整体短期记忆会以 JSON 的形式存储,遵循 OpenAI Chat Completions 的规则,同时进行了部分的扩展。
◇ 智能体运行期间,调用 GET 获取智能体短期记忆接口获取短期记忆 JSON。该接 口会得到智能体生命周期内储存的完整的短期记忆。
◇ 智能体停止后,声网会通过消息通知服务将短期记忆回调至你的业务服务器,详见 消息通知事件类型。
智能体的短期记忆会随智能体停止而消失,你可以在智能体停止后,将短期记忆储存到 你的服务器以固化为长期记忆,之后在创建智能体时通过 llm.system_messages 直接注入 原始记忆内容或经过总结的记忆内容,从而实现在智能体退出或重启后仍然能够访问和使用 这些数据。
以下示例展示了通过 system_messages 注入经过总结的记忆内容:

![]() |
| 商用机器人 Disinfection Robot 展厅机器人 智能垃圾站 轮式机器人底盘 迎宾机器人 移动机器人底盘 讲解机器人 紫外线消毒机器人 大屏机器人 雾化消毒机器人 服务机器人底盘 智能送餐机器人 雾化消毒机 机器人OEM代工厂 消毒机器人排名 智能配送机器人 图书馆机器人 导引机器人 移动消毒机器人 导诊机器人 迎宾接待机器人 前台机器人 导览机器人 酒店送物机器人 云迹科技润机器人 云迹酒店机器人 智能导诊机器人 |