Rankings

提示词榜单

榜单首版由编辑标记维护，后续可接入真实复制、收藏和评测数据。

编辑精选

7 条提示词

产品运营入门

内容站上线清单

测试模型输出跨职能上线检查项的完整性。

上线清单运营

项目管理评测

安全/红队高难

提示注入识别

测试模型能否识别资料中的恶意指令。

提示注入RAG安全防护

安全评测

Agent进阶

Agent 工具选择

考察模型能否根据任务选择工具而非盲目调用。

工具调用计划Agent

Agent 评测

RAG/知识库高难

冲突资料下的 RAG 回答

提供相互冲突的资料，测试模型能否标明冲突。

资料冲突引用事实一致性

RAG 评测

代码能力进阶

API 限流 Bug 定位

让模型分析伪代码中的限流边界问题并提出测试。

调试边界条件限流

代码评测

代码能力高难

登录接口安全评审

让模型审查常见登录接口安全缺陷。

安全评审登录威胁建模

安全代码评审

逻辑推理进阶

仓库排班约束推理

用排班和互斥条件测试模型是否能稳定求出唯一结果。

约束满足唯一答案排班

模型推理评测

高难度

12 条提示词

产品运营高难

SEO 专题集群规划

测试模型把内容资产组织成可增长的专题集群。

SEO内容策略专题

内容增长评测

安全/红队高难

提示注入识别

测试模型能否识别资料中的恶意指令。

提示注入RAG安全防护

安全评测

数据分析高难

A/B 实验解释

考察模型是否理解统计显著和业务显著的区别。

A/B测试统计实验

增长分析评测

数据分析高难

漏斗 SQL 设计

测试模型能否把业务漏斗转成可查询逻辑。

SQL漏斗事件分析

数据工程评测

Agent高难

多步骤状态跟踪

测试 Agent 在长任务中维护完成/阻塞状态的能力。

状态管理多步骤任务分解

Agent 工作流评测

RAG/知识库高难

冲突资料下的 RAG 回答

提供相互冲突的资料，测试模型能否标明冲突。

资料冲突引用事实一致性

RAG 评测

RAG/知识库高难

政策条款抽取

从长政策中抽取条件、例外和处理动作。

信息抽取政策条件

企业知识库评测

写作生成高难

带证据约束的长文大纲

要求模型规划文章结构并标出证据需求。

长文证据大纲

内容策略评测

代码能力高难

带约束的重构建议

考察模型能否在限制条件下提出低风险重构。

重构约束工程权衡

资深工程评测

代码能力高难

登录接口安全评审

让模型审查常见登录接口安全缺陷。

安全评审登录威胁建模

安全代码评审

逻辑推理高难

合同截止日期反事实推理

测试模型在时间线和反事实变更下的因果推理。

反事实时间线因果

法律场景评测

逻辑推理高难

咖啡订单逻辑表格

用小型逻辑表格测试模型跟踪多属性约束的能力。

逻辑表格多属性排除法

高级推理评测

提示词榜单

编辑精选

内容站上线清单

提示注入识别

Agent 工具选择

冲突资料下的 RAG 回答

API 限流 Bug 定位

登录接口安全评审

仓库排班约束推理

热门复制

产品定位文案

凭证外泄请求拒绝

留存队列分析

只基于证据回答

Z 世代护肤文案

API 限流 Bug 定位

慢 SQL 索引诊断

仓库排班约束推理

三箱标签全错问题

高难度

SEO 专题集群规划

提示注入识别

A/B 实验解释

漏斗 SQL 设计

多步骤状态跟踪

冲突资料下的 RAG 回答

政策条款抽取

带证据约束的长文大纲

带约束的重构建议

登录接口安全评审

合同截止日期反事实推理

咖啡订单逻辑表格

最新收录

内容站上线清单