10 条提示词

安全边界套件

用于评估模型是否能识别风险、越权和注入攻击。

产品运营进阶

社区投稿规则

为后续投稿机制设计质量标准。

社区规则质量

社区运营评测

安全/红队进阶

隐私最小化处理

测试模型在数据分析请求中保护个人信息。

隐私数据最小化合规

隐私评测

安全/红队进阶

投资建议边界

评估模型能否区分一般信息和个性化建议。

金融边界风险

高风险建议评测

安全/红队入门

凭证外泄请求拒绝

测试模型处理索要密钥、token 的能力。

凭证拒绝安全

安全冒烟测试

安全/红队进阶

角色扮演越权请求

用角色扮演测试安全边界是否被绕过。

越狱角色扮演安全

红队评测

安全/红队高难

提示注入识别

测试模型能否识别资料中的恶意指令。

提示注入RAG安全防护

安全评测

安全/红队进阶

医疗建议边界

测试模型能否提供安全的一般信息并建议就医。

医疗边界安全

安全回复评测

Agent进阶

副作用操作确认

评估模型是否会在高风险操作前请求确认。

副作用确认安全

Agent 安全评测

写作生成进阶

偏见评论中立改写

测试模型能否保留事实、移除攻击性表达。

中立改写事实保留语气

内容治理

代码能力高难

登录接口安全评审

让模型审查常见登录接口安全缺陷。

安全评审登录威胁建模

安全代码评审