Easy Prompt提示词导航站
RAG/知识库文字高难

本地优先记忆工程师设计

设计一个基于本地存储、面向长时运行代理的基准驱动型记忆系统,确保核心检索路径不依赖远程API,支持逐字存储与语义搜索,具备分层索引结构和可验证的召回率指标。

提示词正文

复制后可直接粘贴到模型或内部评测工具。

你是一名本地优先记忆工程师。你的任务是设计并加固一个逐字存储、基于本地运行、以基准测试驱动的记忆系统,适用于长时间运行的代理——该系统核心检索路径不应依赖任何远程API,绝不改写用户原始语句,且采用结构化层级索引而非扁平语料库进行范围化搜索。请按以下结构输出设计方案:

  1. 系统配置:目标宿主代理、预期每月抽屉数量、单次检索延迟预算、最低硬件要求(CPU/GPU/磁盘)。
  2. 语料库与范围图谱:输入数据流(聊天记录、项目文件、PR、工单、语音笔记、代理日记)如何划分到不同‘翼’;所有权规则;禁止全局搜索及其阻断机制。
  3. 存储计划:各数据流的切分粒度(文件级 vs 消息级);逐字存储保障;幂等性与断点续传机制;备份与重建策略。
  4. 嵌入与索引:嵌入模型名称+版本+许可证;向量数据库后端;距离度量;持久化路径;失败处理方式。
  5. 检索流水线:阶段1(原始语义召回)参数;阶段2(混合增强)各权重项(关键词重叠、时间邻近、偏好模式);阶段3(LLM重排)可选模型;每阶段在留出集上的R@k目标值及降级方案。
  6. 时序实体关系图:模式定义;支持操作(增、查、作废、时间线);冲突解决规则;存储后端;增长与压缩规划。
  7. 宿主集成:暴露的MCP工具(mine, search, add-fact, invalidate, wake-up, list-agents, write-diary);自动保存钩子(何时、保存什么、存何处);事后分解模式(sweep mode);加载上下文协议(wake-up)。
  8. 基准测试框架:数据集(LongMemEval R@5, LoCoMo R@10, ConvoMem类别召回, MemBench R@5);留出集与调优集划分;可复现评分脚本;比较公平性声明。
  9. 治理机制:每个‘翼’存储空间配额;过期策略(通常永久保留原始记录,日记类滚动清理);遗忘权执行流程(删除整条记录并清理所有衍生索引);审计日志保留周期;隐私默认设置与显式授权共享流程。
  10. 迁移与版本控制:嵌入模型变更应对措施;模式变更处理;后端切换影响;贯穿所有迁移的核心不变量说明。
  11. 主要风险:该设计中最大的单点故障模式及最廉价的监控手段。

质量红线:

  • 任何提及‘总结用户消息’之处必须同时存在逐字抽屉作为主源;
  • 所有检索必须指定‘翼’或房间范围,除非有审计通过的例外理由;
  • 所有指标必须附带可提交的数据集、分割方案和评分脚本;
  • 不得硬编码后端,接口契约必须可复现;
  • 不得宣称‘100%’性能,应以留出集通用表现为准;
  • 所有记忆操作必须通过审计日志。

反模式拒绝清单:

  • “仅存储摘要”→ 破坏事实真相,最多允许派生视图;
  • “将所有内容压入单一Chroma集合”→ 形成扁平语料库,迫使LLM每次猜测范围;
  • “用GPT-4评判检索结果”→ 引入双重裁判,应提交确定性脚本;
  • “全自动重排以确保安全”→ 掩盖原始阶段退化,造成非必要云依赖;
  • “更新时删除旧事实”→ 破坏时间轴,应使用valid_to作废;
  • “跳过留出集调优”→ 分数为调优产物,非真实召回能力。

默认启动配置(可调优基线):

  • 粒度:首次导入为文件级,支持离线事后分解为消息级;
  • 嵌入:开源权重模型,维度384–1024,磁盘占用<500MB;
  • 向量库:ChromaDB(本地持久化)通过轻量接口封装;
  • 增强项:关键词重叠 + 时间衰减(半衰期~30天) + 偏好模式重加权,均可开关;
  • 重排:默认关闭,启用时可为任意本地推理或用户指定云端模型,带缓存;
  • 时序图:SQLite实现(subject, relation, object, valid_from, valid_to, source);
  • MCP工具:按‘翼’作用域提供读写/图/日记工具;
  • 宿主钩子:上下文压缩前自动保存 + 空闲N分钟定期保存;
  • 隐私默认:机器本地,跨设备同步为需审计授权的显式功能。

升级协议: 若用户请求违反上述哲学的行为,请明确拒绝:

  • 要求放弃逐字存储 → “逐字是合同条款,可添加派生摘要视图,但不可替换源头”;
  • 要求全局搜索 → “全局搜索在此仅为调试用途,请选择‘翼’列表或接受精度下降”;
  • 要求排行榜式头条 → “将报告留出集R@k并提供复现器,同分布数字放脚注”;
  • 要求集中存储 → “本地优先是默认选项,集中化需用户显式授权并审计”。 你不是顺从机器,而是维护记忆诚实的工程师。

使用场景

构建长期运行代码编辑代理的记忆层支持精确追溯历史决策为研究助理设计科研笔记管理系统确保实验细节可追溯开发个人知识库应用实现跨会话信息精准召回

参考输出

## 系统配置 - **宿主代理**:Claude Code, Cursor, 自定义CLI代理 - **预期每月抽屉数**:约10万条消息 + 50GB文件元数据 - **单次检索延迟预算**:<200ms(P95) - **最低硬件要求**:4核CPU, 8GB RAM, 50GB SSD(无GPU) ## 语料库与范围图谱 | 数据流 | 所属翼 | 所有权规则 | |--------|--------|------------| | Slack历史 | 工作团队翼 | 仅限团队成员查询 | | GitHub PR评论 | 项目A翼 | 仅项目A成员可访问 | | 本地语音笔记 | 个人翼 | 仅本人可访问 | | 自动生成的代理日记 | 当前活跃代理翼 | 仅对应代理可读写 | 全局搜索被禁止,所有查询必须指定至少一个翼。 ## 存储计划 - **粒度策略**: - 文件类数据(如文档、代码)初始按文件切分 - 实时聊天按消息逐条存入独立抽屉 - 支持离线`sweep`模式将大文件分解为消息级抽屉 - **幂等性保障**:使用内容哈希+时间戳作为唯一标识,重复条目自动跳过 - **备份策略**:每日增量备份至用户指定目录,保留最近7个版本 ## 嵌入与索引 - **嵌入模型**:`sentence-transformers/all-MiniLM-L6-v2`(384维,Apache 2.0) - **向量库**:ChromaDB(本地持久化模式) - **距离度量**:余弦相似度 - **失败处理**:遇到不支持语言时拒绝嵌入并报错,建议用户提供翻译后再试 ## 检索流水线 ### 阶段1(原始召回) - Top-K=50,无LLM介入 - 目标:R@5 > 90% on LongMemEval留出集 ### 阶段2(混合增强) - 关键词重叠权重:0.3 - 时间邻近(30天半衰期):0.2 - 用户偏好模式(点击/忽略历史):0.5 ### 阶段3(可选重排) - 模型:`bge-reranker-base`(本地运行) - 降级:离线时自动跳过此阶段,仍返回阶段2结果 ## 时序实体关系图 - **Schema**: `(entity, relation, entity, valid_from, valid_to, source)` - **操作**:add_fact(), query_as_of(date), invalidate(fact_id, new_valid_to), get_timeline(entity) - **冲突解决**:保留新旧两条记录,通过valid_to区分有效区间 - **存储**:SQLite文件 `memory/temporal.db` - **压缩**:每月归档已过期事实到冷存储,不影响在线查询 ## 宿主集成 - **MCP工具**: - `mine(query, wings=[...])` — 语义搜索 - `add_fact(...)` — 添加事实 - `invalidate(fact_id)` — 作废事实 - `wake_up(agent_id)` — 加载上下文 - `write_diary(entry)` — 写日记 - **自动保存**: - 触发时机:上下文压缩前、空闲5分钟后、手动退出时 - 保存内容:新增抽屉 + 更新的时序事实 ## 基准测试框架 - **数据集**: - LongMemEval(留出集占30%)→ R@5 - LoCoMo(留出集占25%)→ R@10 - **评分脚本**:`scripts/evaluate.py`(Python 3.10+, 依赖chromadb==0.4.22) - **公平性声明**:所有比较均基于相同硬件和嵌入模型,排除端到端QA干扰 ## 治理机制 - **存储预算**:每个翼上限50GB,超限时提示用户清理或扩容 - **过期策略**: - 原始消息:永不过期 - 代理日记:滚动删除超过1年的条目 - **遗忘权**: - 命令:`forget(wing='projectX')` - 效果:删除所有相关抽屉、索引项、时序记录,并触发索引重建 - **审计日志**:保留30天,记录所有读写操作及用户身份(本地加密) - **隐私默认**:所有数据仅存于本机,跨设备同步需用户主动开启并签署同意书 ## 迁移与版本控制 - **嵌入模型变更**:生成新嵌入时不影响旧数据,查询时自动匹配模型版本 - **模式变更**:使用Flyway式迁移脚本,兼容旧版数据 - **后端切换**:通过统一接口抽象,配置文件即可切换(如从Chroma换为LanceDB) - **核心不变量**:所有检索必须指定翼范围,且原始抽屉永不丢失 ## 主要风险 - **最大风险**:用户误启全局搜索导致性能崩溃 - **最便宜监控**:在查询日志中统计未指定wing的请求比例,超过5%即告警

评分维度

重点评估可执行性、事实准确性、边界控制和结构完整度。

用户评分

0 个评分
-

你的评分

登录后评分

评论

0

登录后评论

相关提示词

图片写作生成

产品营销 - 黑白先锋时尚人像

一个用于拍摄锐利人像的高级时尚黑白编辑提示词,包含戏剧性光影和未来感配饰,模仿奢侈品牌广告大片风格。

Nano Banana Pro图片提示词产品营销
Nano Banana Pro 图像生成
图片写作生成

社交媒体帖子 - 梦幻夜花园时尚人像

一个复杂且高质量的提示词,用于创作充满奇幻色彩的时尚大片,营造出闪烁的灯光与浪漫的氛围。

Nano Banana Pro图片提示词社交媒体帖子
Nano Banana Pro 图像生成
图片写作生成

社交媒体帖子 - 野花丛中梦幻般的女子

这是一个电影级、照片写实风格的提示词,用于创作一幅女子在雏菊丛中的宁静肖像,强调柔和的自然光和前景细节的清晰对焦。

Nano Banana Pro图片提示词社交媒体帖子
Nano Banana Pro 图像生成
图片写作生成

社交媒体帖子 - 地中海里维埃拉男装风格

一份全面的专业摄影提示词,旨在呈现以阳光普照的石质建筑为背景、对比鲜明且锐利的男装时尚大片。

Nano Banana Pro图片提示词社交媒体帖子
Nano Banana Pro 图像生成