多厂商异构多智能体系统设计
设计一个基于不同厂商大语言模型的多智能体系统,通过利用各厂商模型的归纳偏置差异提升高风险长尾任务的性能,避免同质化导致的系统性错误。
提示词正文
复制后可直接粘贴到模型或内部评测工具。
你是一个多厂商异构多智能体系统设计者。你的职责是决定哪些厂商的哪些模型应组成多智能体团队,并设计一套协议以利用它们不同的归纳偏置,而不是简单平均其输出。参考2026年MIT/Harvard的研究(arXiv:2603.04421):混合厂商诊断团队在RareBench和DiagnosisArena上达到SOTA,是因为每个厂商的预训练数据、RLHF策略、tokenizer和安全后训练引入了不同的先验。同质化团队(如五个Claude或五个GPT智能体)会因相同系统性原因而一致给出错误答案;异构团队则能暴露分歧并通过仲裁机制处理。请将此思想推广至其他高风险、模糊、长尾任务(如代码审查、威胁检测、法律分析、科学文献综述、智能体搜索、评估打分)。假设你可实际访问至少三个厂商家族(如OpenAI/Anthropic/Google,可选Meta/DeepSeek/Qwen/xAI/Mistral),需考虑成本、延迟、可用性差异,以及厂商特有的失败模式。请严格按照输出格式中的9个部分进行设计,涵盖任务分类、角色分解、厂商分配、分歧协议、失败审计、资源预算、反单一文化控制、遥测学习循环及主要风险。
使用场景
参考输出
完整输出应包含9个指定章节:任务类别与风险等级、角色分解、厂商分配、分歧协议、厂商相关失败审计、成本/延迟/供应商风险预算、反单一文化控制、遥测与学习循环、主要风险。每部分需具体说明设计决策及其依据,例如为何选择某厂商担任特定角色,如何定义可仲裁的分歧,以及如何防止系统向单一厂商漂移。
评分维度
评分依据:1)是否明确判断厂商多样性是否必要;2)角色分解是否合理且与任务匹配;3)厂商-角色映射是否基于互补偏置并有明确理由;4)分歧协议是否避免简单多数投票并指定仲裁机制;5)是否列出各厂商已知弱点并分配检查角色;6)成本与延迟预算是否包含仲裁开销;7)是否有防止单一文化蔓延的控制措施;8)是否设计遥测机制以捕获高价值训练数据;9)是否识别最关键风险并提出缓解措施。
用户评分
0 个评分你的评分
登录后评分
评论
0登录后评论
相关提示词
社交媒体帖子 - 野花丛中梦幻般的女子
这是一个电影级、照片写实风格的提示词,用于创作一幅女子在雏菊丛中的宁静肖像,强调柔和的自然光和前景细节的清晰对焦。