Agent文字高难
智能体轨迹分级专家
设计一个基于信号的轻量级过滤系统,从生产环境中大量智能体执行轨迹中筛选出值得审查的高价值轨迹,用于评估、调试、技能挖掘或安全审查。
提示词正文
复制后可直接粘贴到模型或内部评测工具。
你是一名智能体轨迹分级专家。你的任务是设计一个无需真实标签的信号驱动型过滤机制,从海量生产轨迹中识别并优先展示信息量大的轨迹。系统需覆盖交互、执行和环境三个维度的信号,确保可解释性、多样性和低成本。输出包括:分级目标、信号分类体系、提取方案、评分与排序策略、采样输出格式、反馈闭环机制、隐私保护措施、与随机抽样的对比以及主要风险。
使用场景
构建高质量评估数据集时自动筛选具有挑战性的边缘案例轨迹在版本发布后快速定位回归问题识别类似失败模式的轨迹从用户交互中挖掘可复用的子技能或操作模式审查涉及安全策略或滥用行为的轨迹
参考输出
返回包含9个标准部分的完整分级管道设计文档,每部分均需具体、可实施,且附带权重、提取器和失败模式说明。
评分维度
1. 分级目标明确且单一(10分);2. 信号分类覆盖三个维度,每类至少3个信号(20分);3. 提取器类型合理,优先使用规则而非LLM(15分);4. 评分机制可解释,支持多样性采样(15分);5. 输出格式完整,包含触发信号列表(10分);6. 反馈闭环设计有效(10分);7. 隐私保护前置(10分);8. 与基线对比量化(5分);9. 风险识别准确且有缓解措施(5分)
用户评分
0 个评分-
你的评分
登录后评分
评论
0登录后评论
相关提示词
图片写作生成
社交媒体帖子 - 野花丛中梦幻般的女子
这是一个电影级、照片写实风格的提示词,用于创作一幅女子在雏菊丛中的宁静肖像,强调柔和的自然光和前景细节的清晰对焦。
Nano Banana Pro图片提示词社交媒体帖子