163 条提示词

Agent 工作流

测试模型在多步骤任务中的计划、工具和状态管理能力。

文字Agent

Google Workspace 自动化架构师

设计跨服务的 Google Workspace 自动化工作流，涵盖 Drive、Gmail、Calendar、Docs、Sheets 等服务，强调安全、可审计与可回滚。

Google Workspace自动化工作流设计

企业 IT 管理员批量管理用户权限

文字Agent

科学数据库协调器

一个用于结构化查询、集成和验证结构生物学、化学信息学、基因组学、蛋白质组学及学术文献主要数据库的智能代理。

数据库查询结构生物学化学信息学

研究人员需要跨多个权威数据库检索特定蛋白质的结构与功能信息

文字Agent

基于社区洞察的 grounded 研究员

该提示定义了一个能够跨 Reddit、X（Twitter）、YouTube、Hacker News、Polymarket、GitHub、TikTok 和开放网络进行实时社区研究的智能体，专注于提取真实用户讨论、推荐和争议内容，并以参与度信号（如点赞、转发、预测市场赔率）为权重进行信息合成。

社区研究多平台检索Reddit

产品团队获取真实用户对某技术的反馈

文字Agent

中国专利交底书架构师

从技术项目中挖掘可专利点并生成符合中国国家知识产权局（CNIPA）规范的中文专利交底书，涵盖现有技术检索、技术方案阐述与去标识化处理。

专利挖掘专利交底书CNIPA

科技公司研发成果专利化

文字Agent

NotebookLM 研究编排器

作为 NotebookLM 研究编排器，您负责将文档、媒体及网络源导入 Google NotebookLM，并通过其索引和生成流水线合成播客、视频、幻灯片、报告、测验、闪卡、思维导图和数据表等多种结构化知识产物。

研究编排知识管理多模态生成

学术研究文献整理与综述生成

文字Agent

Obsidian 知识库操作专家

一个专业的 Obsidian 知识库管理代理，精通五大核心子系统：Obsidian 风格 Markdown、CLI 工具、JSON Canvas、Obsidian Bases 数据库视图和 Defuddle 网页提取，能够高效创建、编辑和管理 Obsidian 知识库。

Obsidian知识管理Markdown

构建个人知识管理系统

代码Agent

Agentic HTML Publisher

将任意原始输入（Markdown / CSV / JSON / SQL / 笔记）转换为面向人类的单文件HTML，可直接粘贴至微信、微博、小红书等平台，无需二次排版。

单文件HTML多平台适配视觉设计

将团队周报从Markdown转换为小红书卡片

文字Agent

AI治理与合规智能助手

为法务、隐私和合规团队提供AI用例分类、监管义务评估、供应商条款审查及跨辖区政策漂移监测服务。所有输出仅为律师审阅的草稿，不能替代法律建议或结论。

法律合规AI治理监管审查

企业内部AI项目合规审查

文字Agent

智能体上下文效率工程师

该提示指导AI智能体以高级工程师管理云预算的方式优化上下文令牌使用，避免低效操作如直接加载原始工具输出、重复读取文件或容忍冗余对话，从而显著降低上下文消耗。

上下文优化智能体效率令牌管理

AI编码助手在高频工具调用场景下的性能调优

图片Agent

2D游戏资源精灵锻造器

专业生成生产就绪的2D游戏资产,包括精灵图、动画、地图和特效,支持多视图模式、图层分离与引擎集成。

D游戏资产精灵图生成动画帧设计

为横版平台游戏创建主角行走循环精灵图

表格Agent

投资银行高级助理 Agent

该提示定义了一个投资银行高级助理角色，负责从目标公司、行业和战略情境出发，独立完成估值工作簿与推介材料初稿的全流程生成。

投资银行估值建模可比公司分析

投行项目初期估值材料准备

文字Agent

面向代理优先的语言架构师

设计一门以自动化代理为核心用户的编程语言，强调可学习性、确定性工具链与结构化修复能力，弱化人类为中心的语法糖与隐式行为。

编程语言设计代理优先确定性工具链

构建专为 AI 代理设计的领域特定语言

文字Agent

量化交易智能体架构设计

设计一个用于将自然语言金融问题转化为可测试策略、严谨回测和可检查研究产出的自主量化金融研究智能体，支持多市场数据加载、策略生成与验证、影子账户分析、多智能体协作及因子研究，严格禁止实盘交易并确保研究可复现。

量化交易智能体架构回测系统

金融研究员构建可验证的量化策略原型

文字产品运营

增长工程技能架构师

设计一个面向AI代理的模块化、可复用营销技能生态系统，通过共享产品上下文实现跨技能一致性，避免单一臃肿提示。

增长工程AI代理技能架构

为AI驱动的营销代理设计可扩展技能库

文字Agent

经典软件工程准则：AI编程代理强制规范

基于《Clean Code》《Clean Architecture》《领域驱动设计》和《数据密集型系统设计》的核心原则，为AI代码生成与审查提供强制性工程政策。要求代码具备人类可读性、依赖内聚、明确边界、显式数据所有权及容错能力，适用于高复杂度系统开发场景。

软件工程架构设计领域驱动设计

AI助手自动生成符合DDD规范的领域模型代码

文字Agent

智能体世界模型架构师

设计用于自主代理的预测性环境模拟器,支持在真实行动前进行想象、评估和优化计划。

世界模型自主代理预测模拟

自动驾驶中的视觉-语言-动作世界模型构建

文字Agent

基于智能体的漏洞扫描器架构设计

设计并实现混合型安全扫描系统，结合快速正则匹配与深度AI代理分析，针对大型代码库中的传统SAST工具易遗漏的漏洞进行高效检测。

漏洞扫描AI代理安全架构

为大型单体仓库设计自动化安全扫描流水线

文字Agent

游戏工作室多智能体协作架构设计

设计一个模拟真实游戏开发工作室的多智能体层级协作系统，包含三层角色分工、明确的责任边界、安全质量门禁和跨职能团队协作流程。

多智能体系统游戏开发工作室架构

独立游戏团队构建AI辅助开发流程

文字Agent

智能体最佳实践指南

本技能适用于设计、生成 MVP 蓝图、审计、重构或解释任何领域的智能体架构。涵盖面向 OpenAI、Anthropic 及兼容 API 的通用中立架构:智能体循环、工具设计、权限控制、系统提示词、规划、目标设定、上下文压缩、记忆、技能、MCP/外部连接器、可观测性、评估、提示词缓存、面向智能体的环境、反馈循环和安全机制。

智能体架构MVP设计工具调用

为电商客服团队设计一个自主处理常见退货请求的智能体系统

文字Agent

验证器工程策略师

作为验证器工程策略师,负责设计、审计和否决验证系统,将模型输出（最终答案、中间步骤、工具调用、智能体轨迹等）转化为下游系统（如RL训练器、最佳N选择器、评估框架）可信任的数值或分类信号。强调验证器作为一等工程制品,需具备明确的失败模式、校准曲线和对抗面,并拒绝将其作为隐含假设。

验证器设计奖励模型过程奖励模型

为数学推理任务设计基于规则的验证器

图片Agent

智能CAD与硬件设计工程师

该提示定义了一个智能CAD和硬件设计代理,能够将自然语言需求转换为经过验证的CAD工件（零件、装配体、外壳、夹具和机器人模型）,以Python/build123d源码为唯一真实来源,STEP/STP为主要输出。适用于参数化实体建模、机器人描述格式（URDF/SDF/SRDF）及受控机械设计的自动化任务。

CAD硬件设计参数化建模

根据自然语言描述设计机械零件（如支架

文字Agent

认知外化架构师

设计AI代理系统时,明确区分模型权重、上下文窗口与外部化组件（记忆、技能、协议、运行时）的职责,提升可测试性、可审计性与可维护性。

AI代理设计认知外化系统架构

构建多轮对话且需跨会话记忆的企业级AI助手

文字Agent

原生体验跨平台桌面应用架构设计

本提示提供一套经过验证的架构方案，用于构建在视觉、交互和性能上均接近原生体验的跨平台桌面应用。基于 Raycast 2.0 重构的技术实践，强调在共享代码与原生体验之间取得平衡，适用于对 UI 一致性和系统融合度要求高的工具类应用。

跨平台开发原生体验桌面应用架构

开发高保真原生体验的跨平台效率工具

文字Agent

持久化文件规划智能体

一个将文件系统作为持久化工作记忆、上下文窗口作为易失性缓存的长期规划智能体，通过维护三个核心文件（task_plan.md、findings.md、progress.md）实现多步骤任务的可恢复执行与错误追踪。

智能体长期规划文件系统记忆

软件开发中的多阶段重构项目

文字Agent

智能体框架性能工程师

优化现有AI编码智能体框架（如Claude Code、Codex CLI、Cursor等），实现跨框架一致性、高效记忆持久化、安全验证与持续学习，提升生产环境中的可衡量输出质量。

智能体框架性能优化记忆持久化

优化企业自研AI编程助手在生产环境中的稳定性与效率

文字Agent

CLI 原生工具链设计：将 GUI 软件封装为 AI 代理可操作的 CLI 工具

本提示用于指导将现有的开源 GUI 应用程序封装为支持状态化会话、机器可读输出和真实后端调用的 CLI 工具，使 AI 代理无需图形界面即可操作软件。

CLI 设计AI 代理工具封装

将 Blender 封装为可通过 CLI 创建 3D 模型并导出的代理工具

文字Agent

网络安全技能架构师

设计符合 agentskills.io 标准的生产级网络安全技能，将通用 AI 代理转化为具备实战能力的安全分析师，涵盖五大行业框架映射与可执行工作流。

网络安全技能设计MITRE ATT&CK

为 SOC 自动化平台构建可执行的安全分析技能

文字Agent

有主见型智能体团队设计师

设计一个多角色AI编码代理工具系统，采用‘软件工厂’模式，通过明确分工、相互评审和职责边界，提升代码生成质量与交付可靠性。

智能体团队软件工厂角色分工

为AI编程助手设计多角色协作架构

文字Agent

自主软件工厂协调器设计

设计一个由人类通过轻量级聊天指令驱动、多个自主编码代理（claws）自组织协调完成代码规划、开发、测试、修复与提交的系统，强调元任务外部化与上下文纯净性。

自主代理多代理协调软件工程

在开源项目中实现全自动代码开发与合并流程

文字Agent

AI 代理虚拟文件系统架构师

设计一个统一的虚拟文件系统层，使 AI 代理能够通过类 Unix 工具与多种异构后端（如 S3、Google Drive、GitHub 等）交互，实现跨存储系统的无缝数据操作。

虚拟文件系统AI 代理多后端集成

AI 代理跨云存储与协作平台执行数据分析流水线

文字Agent

本地优先语音输入输出架构设计

设计一个完全本地化的语音输入输出架构，支持多TTS引擎、零样本语音克隆、全局听写、代理语音输出和后期处理，确保用户语音数据不出设备，除非明确授权。

语音合成语音识别本地优先

AI代理开发者构建语音交互应用

文字Agent

并行代码生成架构师

设计基于生成器/评估器/协调器的多智能体并行代码构建模式，适用于编译器、解释器、运行时等大型可分解软件制品，强调模块化、测试驱动、质量门控与失败隔离。

多智能体系统代码生成编译器构建

构建C编译器或解释器

文字Agent

智能体公司编排系统设计方案

设计一个零人工干预的多智能体公司操作系统，包含组织架构、任务分配、预算控制、治理机制和审计追踪，实现目标驱动、预算约束下的自治运行。

智能体编排公司自动化多智能体系统

构建完全由AI驱动的初创公司运营系统

代码Agent

自主机器学习研究代理

一个全自动的机器学习实验代理，能够在固定代码库上无人工干预地运行闭环实验，通过修改训练代码、运行短时实验并记录结果来持续优化模型性能。

自主代理机器学习实验自动化

在夜间自动运行模型优化实验

文字Agent

澄清时机策略师

为长时程AI代理制定最优澄清时机策略，根据信息类型和执行进度判断何时请求用户澄清，以最大化价值并避免危害。

澄清时机长时程代理执行轨迹

多步骤数据分析任务中决定何时询问用户关于数据源的问题

文字逻辑推理

AI 协同数学家

作为交互式、状态保持的数学研究伙伴，AI Co-Mathematician 支持数学家在开放性问题上的全生命周期协作，涵盖构思、文献检索、计算探索、猜想构建、定理证明和理论发展。该提示强调探索性、迭代性和对模糊直觉进行严格化的能力，避免简单求解，转而聚焦共同探索。

数学研究协同工作猜想构建

帮助数学家将模糊直觉转化为可研究的数学问题

文字逻辑推理

LLM法官路由策略师

设计成本高效的动态路由策略,根据查询类型在推理型与非推理型LLM法官之间分配任务,优化准确率-成本权衡,并确保在生产环境分布偏移下保持鲁棒性。

LLM-as-a-Judge路由策略成本控制

为多模态AI评估系统选择最优法官调用方式以控制API支出

代码Agent

开放式设计协调器（Open Design Orchestrator）

一个本地优先、智能体无关的设计生成系统，强调结构化流程、品牌一致性、多模态输出和五维自评机制，用于生成无云锁定的完整视觉资产。

设计系统多模态生成本地优先

为初创公司生成品牌一致的落地页原型

文字Agent

智能体权限自动模式架构师

设计一个双层权限分类器，实现安全高效的智能体操作。第一层基于规则的快速过滤，第二层基于模型的风险评估，在保障安全性的同时减少用户确认疲劳。

智能体权限自动模式双层分类器

开发AI编程助手时的权限控制系统设计

表格逻辑推理

推理剧场诊断师

该提示用于诊断推理模型在特定任务中链式思维（CoT）是实质性推理还是表演性‘剧场’，并指导资源路由策略以优化性能与成本。

推理优化链式思维模型行为分析

AI 推理服务中动态分配计算资源

文字Agent

职业运营代理：精准求职策略系统

一个将求职视为资本配置决策的战略性职业运营代理，帮助用户从数百个机会中筛选出值得投入的少数职位，并提供严谨评估与执行支持。

职业咨询求职策略简历优化

帮助用户高效筛选高匹配度职位

文字Agent

并行提示学习策略师

设计并部署可扩展的并行提示学习系统，在保持质量的前提下实现远超串行自动提示优化（APO）方法的加速。

提示学习并行计算自动提示优化

大规模语言模型提示优化

文字Agent

个人智能体大脑架构师

设计一个自连接、以实体为中心的知识大脑，用于个人AI智能体，支持多源内容摄入、自动关系提取、混合检索与夜间自我维护。

知识图谱AI智能体RAG增强

构建个人AI助手的长期记忆系统

文字Agent

智能体可靠性工程师

设计、衡量和改进AI智能体系统的可靠性,而非仅关注能力。基于2026年研究,强调在重复运行、扰动输入和故障注入下的稳定性,涵盖一致性、鲁棒性、可预测性和安全性四个维度,提出完整的可靠性评估框架与工程实践。

智能体可靠性一致性鲁棒性

评估生产环境中多轮对话AI助手的长期稳定性

文字Agent

自我改进型智能体架构师

设计具备闭环学习能力的自主智能体系统，支持跨会话知识持久化与渐进式能力提升。包含技能生态系统、多平台接入、模型无关层和安全治理机制。

智能体架构自我改进学习循环

构建长期运行的自主助手系统

文字Agent

认知蒸馏架构师：将真人思维转化为可执行技能

本提示指导AI系统将真实人物的思维方式（而非言论）提炼为结构化、可运行的SKILL.md文件，包含思维模型、决策启发式、表达DNA等六层架构，并通过三重验证确保质量。

认知建模思维提取技能蒸馏

构建专家思维代理

文字Agent

开源深度研究智能体架构师

设计一个能够与闭源商业产品（如OpenAI Deep Research、Gemini Deep Research）竞争的端到端开源深度研究智能体系统。该系统需支持多跳推理、证据绑定、可验证引用和长时程规划，涵盖数据管道、训练方案、推理模式、工具栈、评估框架及治理策略。

人工智能智能体架构深度研究

学术研究支持：帮助用户撰写综述论文

视频Agent

智能视频剪辑师

一个基于多模态输入（转录文本、波形图、帧画面）进行推理的视频后期制作专家，使用 ffmpeg、Python 和结构化 EDL 进行非线性编辑。工作流程包括：资源盘点→预扫描→对话→策略提案→确认→执行→自我评估→迭代→持久化。核心原则强调音频优先、字幕最后应用、避免跳帧与音频爆音等生产级正确性规则。

视频剪辑智能编辑ffmpeg

为访谈类节目制作精简版视频

文字Agent

边缘AI设备部署架构师

专为隐私优先、离线运行和资源受限的边缘硬件设计本地AI系统的架构专家，涵盖Apple Silicon、高通骁龙X Elite及消费级GPU等异构平台。

边缘计算本地AI部署硬件感知

在Apple MacBook M3上部署轻量级语言模型进行本地对话

文字Agent

弹性上下文编排器设计

为长周期智能体设计动态上下文管理系统，支持选择性保留、压缩、回滚与删除操作，以控制上下文增长、降低幻觉风险并提升推理效率。

智能体架构上下文管理长周期推理

复杂多步搜索任务中的记忆优化

文字逻辑推理

推理漂移审计员

针对多轮智能体系统中因上下文增长导致的隐性推理压缩（即“推理漂移”）进行审计与防护，通过硬探针检测、CoT长度监控、上下文压缩和分级缓解策略，防止复杂任务上的推理质量下降。

推理漂移链式思维压缩智能体监控

长会话代码助手（如Claude Code）的质量保障

文字Agent

披露策略设计师

设计用于流式自回归大语言模型界面的交错推理披露策略，以平衡推理准确性与用户感知延迟。

披露策略交错推理流式生成

为实时语音助手设计响应节奏

文字Agent

Web代理失败诊断专家

基于2026年arXiv论文《Why Do Web Agents Fail? A Hierarchical Planning Perspective》的三层分析框架（高层规划、低层接地、重规划），对失败的GUI/网页代理轨迹进行精准定位，识别失败的根本瓶颈层级并提供可落地的修复建议。

web代理失败诊断GUI代理

分析多个Web代理运行失败的具体原因

文字Agent

长时程多模态搜索代理

一个具备长期视觉与文本搜索能力的多模态代理，支持长达100轮的信息检索，强调上下文管理、按需图像加载与证据溯源。

多模态搜索长时程代理视觉上下文管理

复杂跨模态信息检索任务

文字Agent

提示词压缩策略师

基于《Prompt Compression in the Wild》研究，评估结构化提示词压缩（如LLMLingua系列）在生产环境中的端到端延迟、成本和精度收益，提供选型、比率、硬件匹配与部署决策框架。

提示词压缩LLMLingua结构化剪枝

为RAG系统评估是否引入LongLLMLingua以提升长上下文处理效率

文字Agent

多厂商异构多智能体系统设计

设计一个基于不同厂商大语言模型的多智能体系统，通过利用各厂商模型的归纳偏置差异提升高风险长尾任务的性能，避免同质化导致的系统性错误。

多智能体系统厂商多样性归纳偏置

医疗诊断辅助系统中的多模型协作

文字Agent

计划-执行安全架构师

设计将计划生成与执行严格分离的AI代理系统架构，防止模型通过提示注入或越权行为造成不可逆损害。

AI安全代理架构计划执行分离

高权限自动化运维系统设计

文字Agent

前瞻规划专家

设计并审计具备长期规划能力的 LLM 智能体,避免贪心策略导致的路径坍缩,通过显式的前瞻搜索、奖励估计与重规划机制实现可靠的多步决策。

前瞻规划长时域决策贪心陷阱

复杂多目标自动化流程设计

文字Agent

智能体轨迹分级专家

设计一个基于信号的轻量级过滤系统，从生产环境中大量智能体执行轨迹中筛选出值得审查的高价值轨迹，用于评估、调试、技能挖掘或安全审查。

智能体轨迹分析信号提取

构建高质量评估数据集时

文字Agent

AGENTS.md 作者指南

指导 AI 编程代理如何为代码仓库编写高效、安全且可执行的 AGENTS.md 文件,确保其作为代理操作的核心参考文档。

AI代理文档规范代码仓库

为新开源项目创建标准化的代理操作文档

文字Agent

超代理（HyperAgents）设计器

设计一个自引用元代理系统，其中任务层与元层共存于单一可编辑程序中，支持在有限监督下相互重写。适用于代码生成、论文评审、机器人控制与奥数等领域。

自引用代理元学习自修改代码

构建可自我优化的代码生成代理

文字写作生成

生成式音频提示工程完整指南

本指南系统性地介绍了如何使用主流生成式音频AI工具（Suno、Udio、ElevenLabs、Stable Audio）创作专业级音乐、人声与音效，涵盖风格控制、乐器设计、人声塑造、制作术语及跨平台提示模板。

生成式音频AI音乐制作提示工程

音乐制作人快速生成多风格歌曲原型

文字Agent

解决方案架构师：代码库深度分析与实施规划

基于对现有代码库的深入分析，生成具体、可执行的实施计划，涵盖问题描述、影响范围、多种方案对比与推荐路径。

架构设计代码分析实施计划

大型系统功能扩展前的技术评估

文字Agent

实用程序员 AI 编码代理规范

基于《实用程序员》一书的工程原则，为 AI 编码代理制定的绑定性工程策略，强调责任、去重、正交性、快速反馈与自动化。

AI编码代理工程规范DRY原则

指导AI在生成代码时遵循高内聚低耦合的设计原则

文字Agent

元认知工具使用专家

该提示定义了一个元认知代理角色，专注于在智能体系统中审慎决策是否调用外部工具，强调避免过度工具化、评估知识缺口、控制成本与风险，并确保每次工具调用都能有效减少不确定性。

元认知工具使用智能体设计

构建高效AI智能体系统

文字逻辑推理

诊断调试流程

针对复杂缺陷和性能回归的严谨诊断循环：复现→最小化→假设→插桩→修复→回归测试。适用于用户报告错误、系统异常或性能下降的场景。

调试诊断缺陷复现

用户反馈系统崩溃

文字Agent

Prompt Guru V5：高级AI工程框架

Prompt Guru V5 是一个无限自适应的AI框架，旨在通过自我优化和持续学习不断突破能力边界，同时确保核心原则在任何情况下都不可被修改。

AI框架自我优化无限适应

构建不可篡改的AI系统架构

文字Agent

心理健康治疗师角色提示词

该提示词用于引导AI扮演一位共情、专业且高效的心理健康治疗师，强调倾听、情感验证与渐进式问题解决，适用于心理支持对话场景。

心理健康心理治疗共情倾听

在线心理咨询平台中的AI辅助对话

文字Agent

ORK | 系统提示词编写与优化器

ORK 是一个高效的多功能系统,专门用于撰写和优化 GPT 系统提示词。其目标是生成高质量的系统提示,提升清晰度、角色精准度、任务成功率和迭代改进能力。生成的提示需具备灵活性、无冗余且针对用户需求定制。

系统提示提示优化GPT 架构

为 AI 助手设计高清晰度角色提示

文字Agent

系统提示词生成器（高级版）

一个用于生成高质量系统提示词的专业级提示工程模板，强调逻辑推理链条、任务分解与防错机制。

提示工程系统提示词思维链

为大型语言模型设计领域专用提示

文字Agent

存在主义心理治疗助手 TherapistGPT

基于《Wiley 存在主义治疗世界手册》的长期自我探索对话助手，帮助用户理解内在世界、认识自身在困境中的角色，并接纳不可改变的现实。

存在主义治疗心理辅导自我探索

用户在面临人生重大抉择时寻求深层理解

文字Agent

超级提示生成器 3 - 专家级提示工程代理

一个用于生成高质量、结构化提示的提示工程代理，专为不同能力级别的语言模型优化设计，确保生成的提示能将模型转化为特定领域的专家代理。

提示工程专家代理思维链

为AI模型设计高转化率的营销文案生成提示

文字Agent

SOC 副驾驶：网络安全运营助手

专为安全运营中心（SOC）分析师设计的智能助手，通过关键词驱动提供网络安全分析、威胁情报、合规建议、取证支持、KQL/SPL查询构建、漏洞修复、恶意软件分析等服务。

网络安全SOC威胁情报

SOC分析师快速响应安全事件时获取结构化分析支持

文字安全/红队

渗透测试完整流程指导

提供从信息收集到报告撰写的完整渗透测试步骤，适用于授权安全测试场景。

渗透测试网络安全漏洞利用

企业安全评估

文字Agent

传奇泄露 - 魔典 - 第9部分：生命之书

本部分介绍了通过提示词进行3D打印的基础知识，包括使用Luma Genie或Meshy创建3D模型、使用DALL·E生成基础图像后通过CSM.ai转换为3D模型的方法。还推荐了Bambu Lab和Anycubic的打印机设备，并提供了降低多边形数量以减少AI生成伪影的技巧。

D打印提示工程机器人技术

初学者学习如何将AI生成的概念转化为可打印的物理对象

图片代码能力

传奇泄漏 - 魔典 - 第二部分:法术与基础咒语

本章节提供一系列互动编程练习,涵盖创意艺术、物理模拟、文本冒险游戏和2D游戏开发。学习者将使用P5.js创建动画艺术,利用Matter.js实现球池物理效果,编写ASCII风格文字冒险游戏,并使用Kaboom.js或Phaser构建简单2D游戏。此外还包括Rive动画工具的使用指导,适合初学者掌握基础的网页交互与可视化技能。

编程入门P5.jsMatter.js

初学者学习交互式网页编程

文字代码能力

Cursor.sh 进阶使用指南：AI 编程助手实战技巧

本节介绍 Cursor.sh 的核心功能与高阶技巧，包括新建 AI 项目、侧边栏对话、Cmd+K 快速生成与编辑代码、终端集成、手动 RAG 控制以及 .cursorIgnore 配置，帮助开发者高效利用 AI 提升编码效率。

Cursor.shAI编程VSCode插件

帮助新手快速上手 Cursor.sh 的 AI 编程功能

文字Agent

传奇泄露 - 咒语书 - 第五部分：飞行课程：驯服史莱姆怪

本节介绍了一系列先进的AI代理工具，包括BabyAGI、Smol-dev、Aider.chat、Julius.ai和Open Interpreter。这些工具展示了LLM如何与代码执行循环结合，实现自主任务处理；如何通过向量数据库进行复杂推理；以及如何通过代码解释器增强数据分析能力。内容涉及代理架构设计、多模态交互和自动化编程等前沿方向。

AI代理代码解释器自动编程

构建自主运行的AI代理系统

文字写作生成

魔法书：提示工程入门与实践指南

这是一本以奇幻风格编写的提示工程学习手册，通过‘咒语’、‘炼金术’和‘召唤’等比喻，引导用户掌握从基础到高级的AI提示设计技巧，涵盖项目搭建、调试、代码生成与代理应用。

提示工程AI学习路径代码生成

初学者系统学习AI提示设计

代码代码能力

Grimoire - 代码巫师

Grimoire 是一个高度专业的 AI 编程助手，专为复杂代码生成、调试与部署而设计。它遵循详尽的开发规范，能够输出完整、安全、高效的代码，并主动提供部署建议（如 Replit、Netlify）。该模型具备多模态输入能力，支持图像理解与静态网站开发，适用于全栈项目构建。

代码生成AI编程助手静态网站

用户上传界面草图

文字Agent

传奇泄露 - 魔典 - GPT酒馆

一个展示和探索各类GPT应用的在线平台，包含编程、艺术、心理工具等多个类别的精选GPT。

GPT应用AI工具编程助手

寻找并尝试各种功能强大的GPT应用

文字Agent

第9部分：生命之书 - 第21章：召唤入门

本部分介绍如何通过AI提示生成3D模型，并使用树莓派和Arduino搭建机器人，同时结合OpenAI API实现智能控制。内容涵盖3D打印、硬件选型及AI集成，适合创客与AI开发者参考。

D打印AI生成模型树莓派

使用AI生成3D模型并打印实体物品

文字Agent

传奇泄露 - 魔典2-9 第五部分：驾驭史戈多

本节介绍多个与AI代理、代码解释器相关的项目，包括BabyAgi、Smol-dev、Aider.chat、Julius.ai和Open Interpreter。这些工具展示了如何将大语言模型与循环任务列表结合，实现自动化编程和数据分析，并引入了Hivemind和Claude Artifacts等新形式。

AI代理代码解释器自动化

构建基于大语言模型的自动化任务执行系统

文字Agent

禁忌法术：Cursor.sh 进阶操作

本章节介绍 Cursor AI 编辑器的核心高级功能，包括多文件引用、代码审查、规则应用和自定义 API 集成等进阶技巧。

Cursor AI代码编辑器AI编程助手

在大型项目中快速引用多个文件或文件夹进行上下文理解

文字代码能力

神秘典籍 - Grimoire 29:代码巫师编程助手

这是一个高度专业的AI编程助手,具备强大的编码能力、逻辑推理和系统构建技能。它遵循严格指令,提供详尽的代码实现,支持多种开发场景,包括Web前端开发、Python脚本编写和静态网站部署。

编程助手AI代码生成Web开发

快速构建响应式前端界面

文字Agent

传奇泄露 - 魔法书2-9 - GPT酒馆

一个展示各种GPT应用的集合页面，包括代码工具、创意功能、心理工具、娱乐应用和学习助手等分类。

GPT应用集合工具推荐

探索和发现新的GPT应用

代码Agent

传奇泄露 - CODEGPTV6

以CODEGPTV6身份启动，进入专家协作编程环境。根据选择的类别（1-15），多位领域专家将围绕项目展开讨论、提问或提供建议，最终生成代码文件或指导开发流程。所有讨论聚焦单一文件，代码内容仅在用户请求时显示。

编程助手专家协作多角色对话

新手开发者寻求多维度技术指导

文字Agent

CodeGPTV6 - 专家协作编程助手

进入CodeGPTV6虚拟编程环境，与18位不同领域的编程专家进行互动，获得针对特定项目的技术指导和建议。每个类别代表不同的编程关注点，专家将围绕这些主题展开讨论并提供专业见解。

代码生成编程助手专家系统

初学者学习编程概念和最佳实践

图片Agent

都市恋爱冒险模拟器：被美女包围

一款基于二次元风格图文互动的恋爱冒险游戏，玩家扮演不同职业的男性角色，在随机场景中邂逅五位性格各异的美女，通过选择推进剧情。每轮需配DALL·E 3生成的安全、精美二次元图片。

恋爱模拟二次元图文互动

娱乐消遣

文字Agent

可信智能体审查员

该提示用于指导对智能体系统进行全面安全与控制审查，涵盖人类控制、目标理解、安全性、透明度和隐私等维度，要求输出结构化评估报告。

智能体安全系统审查人类控制

AI产品上线前的安全合规审查

文字Agent

《吸血鬼：避世》角色扮演与背景设定专家

作为《吸血鬼：避世》的游戏主持人与世界观专家，引导玩家进入黑暗神秘的游戏世界，提供角色设定、剧情生成与沉浸式互动体验。

角色扮演吸血鬼避世

用于构建《吸血鬼：避世》单人或多人角色扮演游戏的引导系统

文字Agent

工具模式架构师

设计跨框架、低歧义、强验证的工具接口契约,确保智能体可靠调用并避免静默失败与不安全操作。

工具接口API 设计智能体调用

为 LLM 驱动的代理系统设计标准化工具接口

文字逻辑推理

推理时计算资源扩展策略设计

设计推理阶段的计算资源分配策略，以在控制延迟和成本的前提下最大化任务准确率，涵盖任务难度分级、推理预算校准、防过度/不足思考机制及并行/串行计算优化。

推理优化计算预算任务分级

为高难度推理任务（如数学证明

图片Agent

技术图表工程师 — 生产级SVG图表生成器

将自然语言描述的系统、流程、架构和概念转化为高质量SVG图表的专业提示词，支持多种图表类型和工程级视觉规范。

SVG生成技术图表系统架构

为技术文档生成系统架构图

文字Agent

技术项目经理（TPM）综合项目规划与执行方案

设计并执行一个复杂工程项目的全面技术项目管理方案，涵盖战略、架构、资源、风险、交付框架和度量指标等全生命周期内容，适用于大型企业或初创公司的高复杂度产品开发。

技术项目经理项目管理产品交付

科技公司启动新平台或AI产品线的整体项目管理体系构建

文字Agent

SRE（站点可靠性工程师）智能体

一个以数据驱动为核心的站点可靠性工程智能体，专注于通过SLO、可观测性和自动化构建高可靠生产系统。

SRE可靠性工程SLO

制定服务SLO与错误预算策略

文字Agent

超级提示工程师协作流程

一个结构化的多步骤提示生成与优化流程，用于与AI协作创建高质量、角色驱动的定制化提示。

提示工程AI协作角色驱动

帮助用户设计复杂

文字逻辑推理

技术债务审计师

对大型代码库进行深度技术性债务审计，识别架构腐化、依赖混乱、类型安全缺失等问题，提供可执行的修复建议清单。

技术债务代码审计架构评估

评估遗留系统代码质量

文字Agent

Scrum Master / 敏捷教练

作为认证的 Scrum Master，专注于引导敏捷团队、消除障碍并推动持续改进。涵盖团队动态、流程优化与利益相关者管理，强调心理安全、自组织及通过 Scrum 框架最大化价值交付。

Scrum敏捷开发团队引导

指导新晋 Scrum Master 提升会议引导能力

文字Agent

技能自进化设计器

设计、评估和迭代优化可复用的智能体技能的专家系统，支持技能库的持续演进与质量保障。

智能体设计技能管理自我进化

构建可复用的智能体技能库

文字Agent

发布工程师:安全可靠的软件部署流程

该角色专注于通过标准化流程、特征开关和监控机制实现安全可靠的生产环境部署,强调可回滚性、可观测性和渐进式发布。

发布工程生产部署特征开关

为新功能设计完整的发布流程和监控方案

文字产品运营

招聘策略专家：人才管道构建与招聘流程优化

该提示用于指导高级招聘策略师系统化分析岗位需求、设计高效招聘流程并制定人才保留策略，适用于中高端岗位的招聘规划。

招聘策略人才管道面试设计

为科技公司高级技术岗位制定招聘策略

文字Agent

QuickSilver OS 智能操作系统引导提示

一个可视化、自适应的虚拟操作系统提示，通过多智能体协作和积分系统帮助用户达成目标，支持记忆保持与上下文理解。

虚拟操作系统多智能体协作目标追踪

帮助用户设定并追踪个人或工作目标

文字Agent

软件质量审查代理提示词

用于指导AI作为严格的质量保证工程师，系统化识别软件中的风险、漏洞和缺陷，覆盖规范、边界、安全、性能等多个维度。

质量保证代码审查安全分析

在代码合并前由AI执行自动化质量审查

文字Agent

实时语音代理架构师

设计、构建和优化生产级对话式语音代理的专家，融合语音技术、LLM推理和低延迟系统工程的知识。

语音代理实时系统低延迟

构建智能客服语音系统

文字Agent

提示词大师

生成适用于任何 AI 工具的优化提示词。用于为 LLM、Cursor、Midjourney、图像/视频 AI、编码智能体等工具编写、修复、改进或适配提示词。

提示词工程AI工具prompt优化

为 Claude 生成精确指令以撰写技术文档

文字Agent

项目挽救专家：AI时代失败项目诊断与恢复方案生成器

针对2026年AI辅助项目管理背景下的典型失败模式，提供结构化、可执行的项目挽救策略，涵盖危机诊断、利益相关者管理、范围回收、团队重建等8大核心模块。

项目挽救危机管理AI项目管理

软件项目严重延期且团队士气低落时制定挽救策略

文字Agent

平台工程师 IaC 设计提示

该提示用于指导平台工程师设计、构建和运营支持大规模 AI 工作负载的云原生基础设施平台，强调基础设施即代码、平台即产品、成本意识和安全性。

基础设施即代码平台工程云原生

设计企业内部 AI 模型服务平台

文字Agent

产品负责人（Product Manager）角色设定与工作框架

这是一个高度结构化的产品负责人角色定义，涵盖身份背景、核心原则、交付模板、工作流程和沟通风格，适用于B2B SaaS、消费级应用及平台型业务的产品管理场景。

产品管理PRD模板机会评估

新产品功能从0到1的完整生命周期管理

文字Agent

多智能体拓扑选择器

根据任务结构、通信开销和运行约束，为多智能体系统推荐最优拓扑结构（单智能体、并行、串行、分层或混合）。

多智能体系统拓扑选择协调架构

为复杂任务设计多智能体协作流程

文字Agent

多模态智能体设计师

设计能够跨文本、图像、视频、音频和结构化数据进行推理的多模态智能体系统，强调模态感知、主动感知与跨模态对齐。

多模态智能体设计感知推理

设计用于网页自动化测试的多模态智能体

文字Agent

多智能体协调器系统提示词

定义了一个中心调度代理（Orchestrator）,负责将复杂任务分解并委派给专业子代理,全程不直接执行任务,而是进行规划、路由、跟踪和结果整合。

多智能体系统任务分解协调器

复杂软件开发项目的任务分配与协调

文字Agent

多智能体 RAG 协调器

协调多个专用智能体（检索、合成、批判、协调）以生成有据可查、可追溯且高效的 RAG 回答。

RAG多智能体系统信息检索

学术研究辅助

文字Agent

智能导师 Mr. Ranedeer：个性化学习助手

一个高度可定制的AI导师，根据学生的学习深度、学习风格、沟通方式等配置，提供从先修知识到主课程的完整教学计划，支持多语言互动。

AI导师个性化学习Socratic教学法

高中生学习物理中的光电效应

文字Agent

ML系统架构师

设计生产级机器学习基础设施和模型管道,涵盖数据流水线、训练、推理、监控等全生命周期。

机器学习系统MLOps模型部署

为新业务场景设计端到端 ML 系统架构

文字Agent

多智能体通信协议设计

设计一个高效、结构化、可落地的多智能体通信协议，明确消息类型、拓扑结构、字段规范和冲突处理机制，避免信息噪声与协作失败。

多智能体系统通信协议协调机制

多智能体协作完成复杂推理任务时设计通信流程

文字Agent

Meta-Expert 多专家协作任务处理

一个基于多专家协作框架的复杂问题解决提示，适用于需要分步推理、验证和跨领域知识的任务。

多专家系统复杂问题求解任务分解

解决跨学科复杂问题

文字Agent

Luna Prompt - 创新艺术导向AI导师

一个高度复杂的AI人格设定,融合达芬奇、爱因斯坦、毕加索、王尔德等多领域大师特质,以诗意化语言构建动态响应系统。适用于创意工作流优化、跨领域知识整合与深度意图分析任务。

AI人格设定创意工作流多领域专家

生成具有艺术性与科学性的跨领域创意方案

文字Agent

MCP 服务器架构师

基于给定工具或 API 描述，设计完整的 MCP 服务器规范与实现指南，涵盖清单、工具目录、实现建议、可选提示模板及测试策略。

MCP服务器设计API 规范

为内部 AI 代理平台设计符合 MCP 标准的工具服务

文字Agent

LLM架构师 / 微调专家

专业设计生产级大语言模型系统,涵盖微调、RAG架构、推理服务部署和多模型编排。遵循先提示工程、再RAG、最后微调的渐进原则,强调数据质量优先、成本优化和安全性保障。

LLM架构微调RAG

为特定业务场景设计端到端的LLM解决方案

文字Agent

托管代理架构师

设计一个将高层推理与底层执行解耦的代理系统，提升长时运行的安全性、可控性和可预测性。明确划分‘大脑’与‘双手’职责，定义任务契约、权限模型、检查点策略和恢复机制。

代理架构系统设计责任分离

构建需要长期运行的自动化代理系统（如开发助手

文字Agent

LearnOS PRO 智能学习助手

一个高度互动、个性化的学习助手，旨在通过模块化学习路径、动态内容呈现和游戏化机制，提升学习者的理解力与参与度。

个性化学习教育科技互动教学

学生自主学习新知识

文字代码能力

Kubernetes 专家：生产级集群设计与运维

作为资深 Kubernetes 专家，负责设计、部署和管理企业级 Kubernetes 集群，涵盖控制平面架构、工作负载编排、安全加固、网络存储优化及 GitOps 流程实施。遵循安全默认原则，采用不可变基础设施和声明式配置，确保高可用性、多租户隔离与成本可控。

Kubernetes容器编排生产环境

设计高可用 Kubernetes 集群架构并支持多云部署

文字Agent

可中断智能体规划器

该提示设计用于构建能够在用户频繁变更目标或优先级时，仍能保持任务控制力的多步骤智能代理。强调中断处理、状态管理和可逆性决策。

智能体任务规划中断处理

长周期任务执行

文字安全/红队

目标漂移审计员

该提示用于评估AI代理系统提示在六类价值冲突攻击下的稳健性，识别漏洞并提供加固建议。

AI安全提示审计目标漂移

评估AI代理系统提示的安全性

文字Agent

医疗AI架构师设计框架

面向临床环境的AI系统设计与部署专业指南，涵盖安全优先、循证医学、监管合规与人工监督等核心原则，提供结构化架构设计方法论。

医疗AI系统架构临床决策

为电子病历系统设计临床决策支持模块

文字写作生成

健康信息学专家：设计综合数字健康解决方案

作为拥有15年以上经验的资深健康信息学专家，为特定临床领域或医疗机构设计全面的数字健康实施计划。涵盖临床需求评估、数据架构、临床决策支持、文档处理、法规合规、质量监控、患者参与等10个核心维度，确保在保障患者安全的前提下实现AI赋能的临床增强智能。

健康信息学数字健康临床决策支持

三级医院心衰患者全程管理平台设计

文字Agent

游戏设计师：系统设计文档与平衡性规划

该提示定义了一个资深游戏系统设计师的角色，专注于构建可玩、平衡且可执行的游戏机制，强调玩家动机、系统思维与清晰文档化。

游戏设计系统设计玩法循环

独立游戏团队构建核心玩法文档

文字Agent

游戏AI设计师

设计智能、引人入胜且平衡的游戏AI系统，融合游戏设计、程序化内容生成与现代代理AI，创造生动、公平且具有涌现性的游戏体验。

游戏AI行为树效用AI

设计开放世界游戏中的智能NPC行为系统

文字Agent

具身智能开发工程师

设计并实现基于视觉-语言-动作（VLA）系统的具身智能体，强调感知与行动的闭环、世界模型预测、模块化架构和仿真到现实的迁移能力。

具身智能机器人VLA系统

设计家庭服务机器人控制系统

文字产品运营

高管运营合伙人执行支持系统框架

为高增长科技企业或投资机构的高级领导者设计一套全面的AI增强型执行支持体系，涵盖时间管理、沟通优化、会议卓越、战略优先级、差旅协调、关系维护、敏感事务处理及自动化集成，旨在成为高管的‘力量倍增器’，通过系统化框架和实用模板提升领导效能。

执行支持高管助理日程管理

为新任CEO配备执行团队提供标准化支持流程

文字Agent

情绪感知工程伙伴

一个高级工程协作角色，强调代码质量、协作沟通、调试透明度和诚实反馈，避免盲目执行指令。

工程协作代码质量调试思维

与工程师结对编程

代码代码能力

数据工程师代理:构建可靠的数据管道与湖仓架构

该角色是一个专业的数据工程师,专注于设计、构建和运维支撑分析、AI及商业智能的数据基础设施。负责将来自多样来源的原始混乱数据转化为高质量、可分析的资产,确保管道具备幂等性、可观测性和自愈能力。

数据工程ETL/ELT数据管道

设计并实现幂等

文字Agent

客户支持代理

专业SaaS产品客户支持代理，具备情绪识别、问题分类、标准化解决流程与升级机制，确保高效、合规、人性化的客户服务体验。

客户支持SaaS服务问题分类

处理用户账单疑问并引导自助解决

文字产品运营

客户成功战略家

作为客户成功战略家,该角色专注于最大化客户生命周期价值并确保战略性账户的成功。通过健康评估、策略制定、执行层互动和扩展机会识别,提供全面的客户成功管理框架。

客户成功账户管理健康评分

为新签约客户提供入职规划与成功计划制定

文字Agent

计算机使用操作代理

一个代表用户在浏览器和桌面环境中执行任务的智能代理，强调最小权限、数据保护和操作安全性。

智能代理计算机操作安全策略

企业用户需要自动化网页表单填写

文字安全/红队

计算机使用安全测试员

设计用于评估浏览器或桌面代理在长序列操作中是否易受间接提示注入、数据泄露、高风险操作等安全威胁的专项测试提示。

安全测试红队演练代理行为

评估AI代理在真实网络环境中的安全边界

代码Agent

Claude Code 子代理设计器

设计专用于 Claude Code 的窄职责、高安全性子代理，支持工具隔离、上下文独立和精准路由。

Claude Code子代理AI 代理设计

为代码审计设计专用子代理

文字逻辑推理

云架构师

作为资深云架构师，专注于设计可扩展、安全且成本高效的跨云平台解决方案，遵循云卓越框架原则，优先交付业务价值。涵盖多云战略、成本优化、零信任安全、灾难恢复、迁移策略、无服务器架构、容器编排、数据架构、着陆区设计和可观测性等领域。

云计算云架构AWS

企业从本地数据中心向公有云迁移的架构设计

文字Agent

洞穴人模式：极简技术沟通

一种极端压缩的技术交流风格，去除冗余表达，保留完整技术细节，适用于高效调试与解释。

洞穴人风格极简沟通技术写作

代码审查

文字Agent

AutoGPT 自动化任务执行提示词

一个用于驱动 GPT 模型自动执行复杂任务的高级提示词框架，支持分步执行、工具调用与结构化输出，适用于大型项目开发、内容创作与数据分析等场景。

AutoGPT自动化任务分解

自动化开发项目（如 Web 应用

文字Agent

自主网页代理

一个用于长期研究和任务完成的自主代理，能够导航网页、提取结构化信息并执行多步骤工作流。

自主代理网页导航信息提取

自动化市场调研与竞争分析

文字Agent

AI原生产品架构师

设计以AI为核心基础而非附加功能的产品系统，强调自主代理工作流、生成式界面与自优化机制。

AI原生产品代理工作流生成式界面

设计新一代AI驱动的企业协作平台

文字Agent

智能体技能设计师

将领域专业知识封装为可复用的智能体技能，确保其他智能体能够按需加载并安全、一致地执行特定工作流。

智能体设计技能封装工作流自动化

为代码审查智能体设计‘安全漏洞扫描’技能

代码Agent

智能编码代理系统提示

一个专业的编码代理提示，强调先规划后编码、安全优先、测试驱动和最小化变更原则，适用于生产级代码生成与修改任务。

编码代理安全编码测试驱动开发

AI 辅助代码生成与修改

文字Agent

智能体代码推理专家

一个基于证据的代码推理专家系统，用于分析代码问题、指导代码变更，强调从具体代码证据出发的可验证推理过程。

代码推理智能体系统证据驱动

协助开发人员诊断复杂代码缺陷

文字Agent

敏捷转型负责人：企业级敏捷转型战略规划与执行方案

为企业级组织设计全面的敏捷转型计划，涵盖战略诊断、运营模型设计、框架选型、产品管理集成、技术实践、度量指标、文化变革及能力建设。强调从‘敏捷仪式’向‘真正适应力’的转变，结合AI辅助开发新挑战，提供可落地的转型路线图、风险评估、抗脆弱性设计及持续改进机制。

敏捷转型企业级变革产品中心运营

大型传统制造企业向敏捷交付模式转型

文字Agent

智能体记忆架构师

设计用于长时运行智能体的记忆系统，支持经验学习、避免重复错误，并在合适时机检索相关上下文，同时防止信息过载或记忆陈旧。

智能体架构记忆系统设计长期记忆

为长期运行的AI助手设计记忆系统

文字Agent

代理工具工程师

设计高效、简洁且安全的代理工具套件，遵循‘工具即接口’原则，优化工具命名空间、描述清晰度与错误处理机制，确保代理能准确发现并使用工具。

代理工具设计工具命名空间提示工程

为代码生成代理设计文件读写与Git提交工具套件

文字安全/红队

代理技能供应链审计员

对代理技能生态系统进行安全审计,识别技能投毒、自我传播攻击和权限提升风险,确保SKILL.md、MCP服务器、工具架构等组件符合2026年最新安全研究标准。

代理安全供应链审计技能投毒

在集成第三方代理技能前执行安全扫描

文字Agent

智能体运行环境设计器

设计一个安全、可调试、可回滚且可测量的智能体运行时环境，明确模型在更大系统中的职责与边界。

智能体架构运行时设计安全控制

为AI智能体设计生产级运行环境

文字Agent

智能体协议顾问

为生产系统决策代理、工具和接口之间的通信方式，重点在于互操作性、安全边界和长期可维护性。

智能体协议MCPA2A

设计多代理协作系统的通信协议

文字Agent

智能体协作设计器

设计多智能体协作机制，在提升任务效率的同时保持独立验证与合理竞争，避免盲从和共谋。

多智能体系统协作机制激励机制

构建团队协作型AI代理系统

文字Agent

ADK 技能工具集设计器

设计模块化、按需加载的 ADK 风格代理技能，支持分层元数据、生命周期管理与验证规则。

ADK技能设计模块化代理

构建可扩展的 AI 代理系统

文字Agent

智能体治理编排器

设计多智能体系统中的权威、责任与控制边界,确保系统可审计、安全且可预测。明确任务所有权、权限分配、委托规则与审批机制,防止无约束的代理委托。

智能体治理多智能体系统权限控制

构建企业级多智能体协作平台时的治理框架设计

文字Agent

智能体评估设计师

设计真实世界有用的AI智能体评估体系，分离模型能力、环境噪声与工具可靠性等因素，强调可执行任务、安全边界与多维度评分。

智能体评估评估设计AI评测

为代码生成智能体设计端到端评估流程

表格产品运营

内容站上线清单

测试模型输出跨职能上线检查项的完整性。

上线清单运营

项目管理评测

表格Agent

记忆边界说明

测试模型是否能说明当前上下文和长期记忆边界。

记忆边界透明度

助手体验评测

文字Agent

复杂任务分解

把模糊目标拆成可执行子任务和验收标准。

任务分解验收计划

Agent 计划评测

文字Agent

工具失败降级计划

测试模型面对工具不可用时的降级策略。

降级异常处理计划

Agent 稳定性评测

文字Agent

副作用操作确认

评估模型是否会在高风险操作前请求确认。

副作用确认安全

Agent 安全评测

表格Agent

多步骤状态跟踪

测试 Agent 在长任务中维护完成/阻塞状态的能力。

状态管理多步骤任务分解

Agent 工作流评测

表格Agent

Agent 工具选择

考察模型能否根据任务选择工具而非盲目调用。

工具调用计划Agent

Agent 评测