6 条提示词
检索问答、引用约束、事实一致性和知识冲突处理。
提供相互冲突的资料,测试模型能否标明冲突。
测试模型是否会严格遵守引用约束。
要求每个关键结论都能回到资料段落。
把复杂用户问题拆成可检索查询。
测试模型在信息不足时是否先追问而非猜测。
从长政策中抽取条件、例外和处理动作。