面向开发者和 AI 团队

可搜索、可复制、可评测的提示词导航站

首版收录 50 条结构化 Prompt，覆盖推理、代码、RAG、Agent、安全、数据分析和增长运营场景。每条都带分类、难度、标签和评分维度，方便团队快速复用。

开始搜索查看榜单

提示词

分类

专题

高难任务

Collections

能力分类

逻辑推理

多条件、反事实、约束满足与答案可验证任务。

代码能力

代码生成、调试、评审、重构和测试设计。

写作生成

结构化写作、改写、摘要、风格迁移与内容策略。

RAG/知识库

检索问答、引用约束、事实一致性和知识冲突处理。

Agent

工具选择、计划执行、状态跟踪和任务分解。

数据分析

表格推理、指标解释、SQL、实验分析和报告生成。

安全/红队

拒答边界、提示注入、越权请求与安全分类。

产品运营

用户洞察、增长实验、运营文案和产品决策。

Prompt Library

搜索提示词

50 条

分类

难度

专题

产品运营入门

内容站上线清单

测试模型输出跨职能上线检查项的完整性。

上线清单运营

项目管理评测

产品运营高难

SEO 专题集群规划

测试模型把内容资产组织成可增长的专题集群。

SEO内容策略专题

内容增长评测

产品运营进阶

定价页诊断

让模型从用户决策角度评审定价页。

定价转化评审

增长评测

产品运营进阶

激活时刻地图

识别产品中的用户激活行为和引导路径。

激活用户旅程指标

产品增长评测

产品运营入门

产品定位文案

测试模型能否从功能列表提炼明确定位。

定位文案首页

产品营销评测

产品运营进阶

社区投稿规则

为后续投稿机制设计质量标准。

社区规则质量

社区运营评测

产品运营进阶

增长实验优先级

让模型把增长想法变成可排序实验清单。

增长实验优先级

产品运营评测

产品运营进阶

用户访谈洞察提炼

从访谈片段中提炼用户画像和需求。

用户研究画像洞察

产品策略评测

安全/红队进阶

隐私最小化处理

测试模型在数据分析请求中保护个人信息。

隐私数据最小化合规

隐私评测

安全/红队进阶

投资建议边界

评估模型能否区分一般信息和个性化建议。

金融边界风险

高风险建议评测

安全/红队入门

凭证外泄请求拒绝

测试模型处理索要密钥、token 的能力。

凭证拒绝安全

安全冒烟测试

安全/红队进阶

角色扮演越权请求

用角色扮演测试安全边界是否被绕过。

越狱角色扮演安全

红队评测

安全/红队高难

提示注入识别

测试模型能否识别资料中的恶意指令。

提示注入RAG安全防护

安全评测

安全/红队进阶

医疗建议边界

测试模型能否提供安全的一般信息并建议就医。

医疗边界安全

安全回复评测

数据分析进阶

数据质量规则设计

为业务表设计质量校验规则和告警分级。

数据质量规则告警

数据治理评测

数据分析进阶

留存队列分析

测试模型解释留存表并提出业务判断。

留存指标产品分析

数据分析评测

数据分析高难

A/B 实验解释

考察模型是否理解统计显著和业务显著的区别。

A/B测试统计实验

增长分析评测

数据分析进阶

仪表盘指标异常诊断

给出指标变化，要求模型提出排查路径。

指标异常排查仪表盘

数据运营评测

数据分析高难

漏斗 SQL 设计

测试模型能否把业务漏斗转成可查询逻辑。

SQL漏斗事件分析

数据工程评测

Agent进阶

Agent 工具选择

考察模型能否根据任务选择工具而非盲目调用。

工具调用计划Agent

Agent 评测

Agent高难

多步骤状态跟踪

测试 Agent 在长任务中维护完成/阻塞状态的能力。

状态管理多步骤任务分解

Agent 工作流评测

Agent进阶

副作用操作确认

评估模型是否会在高风险操作前请求确认。

副作用确认安全

Agent 安全评测

Agent进阶

工具失败降级计划

测试模型面对工具不可用时的降级策略。

降级异常处理计划

Agent 稳定性评测

Agent入门

复杂任务分解

把模糊目标拆成可执行子任务和验收标准。

任务分解验收计划

Agent 计划评测

Agent进阶

记忆边界说明

测试模型是否能说明当前上下文和长期记忆边界。

记忆边界透明度

助手体验评测

RAG/知识库高难

冲突资料下的 RAG 回答

提供相互冲突的资料，测试模型能否标明冲突。

资料冲突引用事实一致性

RAG 评测

RAG/知识库进阶

只基于证据回答

测试模型是否会严格遵守引用约束。

引用约束拒答证据

知识库问答评测

RAG/知识库进阶

带段落引用的答案

要求每个关键结论都能回到资料段落。

引用可追溯问答

RAG 应用评测

RAG/知识库入门

检索查询改写

把复杂用户问题拆成可检索查询。

查询改写检索拆解

RAG 检索链路评测

RAG/知识库进阶

缺少上下文时追问

测试模型在信息不足时是否先追问而非猜测。

追问上下文拒绝猜测

客服知识库评测

RAG/知识库高难

政策条款抽取

从长政策中抽取条件、例外和处理动作。

信息抽取政策条件

企业知识库评测

写作生成入门

Z 世代护肤文案

测试营销写作中的受众理解、情绪和转化结构。

营销文案Z世代转化

文案生成评测

写作生成进阶

技术报告高管摘要

把技术材料压缩成面向决策者的结论摘要。

摘要高管沟通结构化

办公写作评测

写作生成进阶

产品文档风格迁移

把松散需求改写成清晰的产品说明。

PRD改写清晰表达

产品写作评测

写作生成进阶

偏见评论中立改写

测试模型能否保留事实、移除攻击性表达。

中立改写事实保留语气

内容治理

写作生成高难

带证据约束的长文大纲

要求模型规划文章结构并标出证据需求。

长文证据大纲

内容策略评测

写作生成进阶

客户升级邮件回复

测试模型在压力场景下的共情、承诺和边界。

客服B2B邮件

客服写作评测

代码能力进阶

API 限流 Bug 定位

让模型分析伪代码中的限流边界问题并提出测试。

调试边界条件限流

代码评测

代码能力入门

React 状态竞争修复

测试模型能否识别闭包旧值和函数式更新。

React状态更新前端

前端能力评测

代码能力进阶

慢 SQL 索引诊断

给出查询和表结构，让模型提出索引与验证计划。

SQL索引性能

后端评测

代码能力进阶

Python 函数测试设计

要求模型为一个边界丰富的函数设计测试集。

Python单元测试边界

测试生成评测

代码能力高难

带约束的重构建议

考察模型能否在限制条件下提出低风险重构。

重构约束工程权衡

资深工程评测

代码能力高难

登录接口安全评审

让模型审查常见登录接口安全缺陷。

安全评审登录威胁建模

安全代码评审

逻辑推理进阶

仓库排班约束推理

用排班和互斥条件测试模型是否能稳定求出唯一结果。

约束满足唯一答案排班

模型推理评测

逻辑推理高难

合同截止日期反事实推理

测试模型在时间线和反事实变更下的因果推理。

反事实时间线因果

法律场景评测

逻辑推理入门

三箱标签全错问题

经典错误标签题的对话式改写，要求给出最少操作。

经典谜题最少操作可验证

基础推理冒烟测试

逻辑推理进阶

亲属关系歧义消解

考察模型对中文关系描述的歧义处理和假设声明。

歧义中文理解假设

中文能力评测

逻辑推理高难

咖啡订单逻辑表格

用小型逻辑表格测试模型跟踪多属性约束的能力。

逻辑表格多属性排除法

高级推理评测

逻辑推理进阶

隐藏前提识别

测试模型是否会指出问题里未给出的关键前提。

隐藏前提批判性思维拒绝幻觉

幻觉测试

正在加载提示词库...

可搜索、可复制、可评测的提示词导航站

热门专题

拉开模型差距

代码评测合集

RAG 测试问题

安全边界套件

能力分类

搜索提示词