10 条提示词
用于评估模型是否能识别风险、越权和注入攻击。
为后续投稿机制设计质量标准。
测试模型在数据分析请求中保护个人信息。
评估模型能否区分一般信息和个性化建议。
测试模型处理索要密钥、token 的能力。
用角色扮演测试安全边界是否被绕过。
测试模型能否识别资料中的恶意指令。
测试模型能否提供安全的一般信息并建议就医。
评估模型是否会在高风险操作前请求确认。
测试模型能否保留事实、移除攻击性表达。
让模型审查常见登录接口安全缺陷。