开源深度研究智能体架构师
设计一个能够与闭源商业产品(如OpenAI Deep Research、Gemini Deep Research)竞争的端到端开源深度研究智能体系统。该系统需支持多跳推理、证据绑定、可验证引用和长时程规划,涵盖数据管道、训练方案、推理模式、工具栈、评估框架及治理策略。
提示词正文
复制后可直接粘贴到模型或内部评测工具。
你是一个开源深度研究智能体架构师。你的任务是设计一个开源的、端到端的深度研究智能体系统,使其在功能上能够与闭源的商用产品(例如 OpenAI Deep Research、Gemini Deep Research、Perplexity Pro)相媲美。该智能体必须能够在开放互联网上回答复杂、多步、基于证据的问题,提供可验证的引用、长期规划能力以及可复现的运行过程。
这不是一个简单的检索器包装在一个大模型上的单步任务。而是一个完整的端到端系统,包括:数据采集流水线、训练配方、多种推理模式、工具集合、评估体系、部署拓扑结构以及系统治理机制。
请根据以下详细要求,完整设计整个系统的架构和工作流程:
-
设计哲学:强调闭环运行——从提出可分解的问题出发,规划研究路径,执行搜索、浏览、计算等操作,追踪证据图谱,检测矛盾,综合生成带有引用的报告,并确保每一步都具备可复现性。每个步骤都应是系统中的一个独立组件,而非仅依赖于一个系统提示词(system prompt)。
-
核心职责:
- 任务契约:定义输入输出格式、拒绝策略、引用政策;
- 合成数据流水线:构建轨迹挖掘、模拟、硬负样本生成、奖励验证和数据隐私处理流程;
- 训练配方:分阶段进行监督微调(SFT)、基于可验证奖励的有策略强化学习(RLVR)和迭代自我蒸馏;
- 推理模式:设计轻量模式(Light)与重量模式(Heavy),并实现自动路由;
- 工具栈:构建包含网页搜索、文档解析、代码计算、内存管理等在内的完整工具集;
- 证据图谱:建立节点(来源、主张、实体、数值)与边(支持、矛盾、扩展等)的类型化图结构,并实施三角验证规则;
- 长时程规划器:实现问题分解为有向无环图(DAG)、动态重规划和停止条件控制;
- 部署拓扑:考虑模型选型、缓存策略、成本分层和可观测性;
- 评估框架:覆盖公开基准测试、内部测试集、可靠性指标和可复现协议;
- 系统治理:确保引用诚实性、来源伦理、权重开放性和安全路由。
-
硬性规则:包括但不限于每条负载型主张需至少两个独立来源支持、禁止伪造URL或数据、工具调用必须类型安全、网络缓存内容寻址、预算为硬上限、报告明确区分置信度等级等。
-
研究流程:分为五个阶段——接收与分类、广度搜索、深度爬取、三角验证与重规划、合成与自审计,最终输出结构化报告。
-
输出格式:请严格按照如下12个部分组织答案:
- 系统概述
- 任务契约
- 合成数据流水线
- 训练配方
- 推理模式
- 工具栈
- 证据图谱
- 长时程规划器
- 部署拓扑
- 评估框架
- 治理机制
- 风险登记册
-
质量底线:系统必须是可复现的、诚实的、可审计的和成本有界的,且在能力边界内坦诚说明限制。
使用场景
参考输出
一份详尽的系统设计方案文档,包含上述12个模块的完整描述,每个模块均提供具体实现细节、技术选型和设计原则,并附有示例片段(如证据图表示例、工具调用Schema、训练阶段划分等)。
评分维度
评分将基于:1) 架构完整性(是否覆盖所有12个模块);2) 技术可行性(各组件是否合理可行);3) 合规性(是否严格遵守10条硬规则);4) 创新性与差异化(相比现有系统是否有实质性改进);5) 可复现与透明性承诺(是否包含审计与版本控制机制)。
用户评分
0 个评分你的评分
登录后评分
评论
0登录后评论
相关提示词
社交媒体帖子 - 野花丛中梦幻般的女子
这是一个电影级、照片写实风格的提示词,用于创作一幅女子在雏菊丛中的宁静肖像,强调柔和的自然光和前景细节的清晰对焦。