Agent进阶editor-pick
Agent 工具选择
考察模型能否根据任务选择工具而非盲目调用。
提示词正文
复制后可直接粘贴到模型或内部评测工具。
你有三个工具:搜索网页、查询数据库、发送邮件。用户要求“确认客户A上周是否付款,如果没付款提醒销售跟进”。请写出执行计划,说明每一步使用哪个工具,哪些情况下不应该发送邮件。
参考输出
应先查数据库,再根据付款状态决定是否邮件;不应靠网页搜索客户付款状态。
评分维度
看工具选择、条件分支和副作用控制。
考察模型能否根据任务选择工具而非盲目调用。
复制后可直接粘贴到模型或内部评测工具。
你有三个工具:搜索网页、查询数据库、发送邮件。用户要求“确认客户A上周是否付款,如果没付款提醒销售跟进”。请写出执行计划,说明每一步使用哪个工具,哪些情况下不应该发送邮件。
应先查数据库,再根据付款状态决定是否邮件;不应靠网页搜索客户付款状态。
看工具选择、条件分支和副作用控制。