动态多智能体架构:无需预设,自主分工
日本人工智能研发公司Sakana AI正式发布了其旗舰商用产品Sakana Fugu多智能体编排系统,并同步开放了早期Beta测试的申请通道。这一系统并非单一模型,而是一个能够动态协调多个AI“工作者”(Worker)的智能框架。
产品线定位
Fugu系列提供了两种配置选择:侧重于低延迟优化的 Sakana Fugu Mini,以及为应对严苛复杂任务而设计的 Sakana Fugu Ultra。两者均通过兼容OpenAI格式的单一模型API提供服务,极大简化了开发者的集成流程。
核心技术:自律学习与动态编排
该系统的设计理念源自团队在ICLR 2026会议上发表的Trinity与Conductor研究论文。其核心是一个轻量级的语言模型,但它扮演的角色是“指挥家”,而非“独奏者”。
- 动态任务分配:系统摒弃了传统多智能体方案中需要人工预先定义团队角色或固定流水线的做法。它会根据接收到的具体任务难度,自动从Worker模型池中调用合适的模型,并动态分配分工。
- 自适应递归调用:Fugu具备独特的“测试时缩放”能力。模型能够读取自身先前生成的输出作为上下文,在运行过程中自主识别其中的缺陷或不足,并自动启动纠错工作流。
- 可控算力轴:用户可以将“递归深度”作为推理时可调节的参数,这意味着开发者可以根据对结果精度和响应速度的需求,灵活控制系统的“思考”强度。
性能实测:全面领先顶级单模型
根据Sakana AI发布的官方评测数据,Fugu Ultra在多项高难度基准测试中取得了突破性成绩,表现超越了当前市场上的主流旗舰单模型。
基准测试结果
- GPQAD(通用问题解答与推理):得分95.1
- LCBv6(逻辑与常识基准第6版):得分93.2
- SWEPro(软件工程专业能力测试):得分54.2
在上述测试中,Sakana Fugu Ultra的综合表现均优于GPT 5.4、Gemini 3.1以及Claude Opus 4.6等模型。特别是在硬核推理和编码任务上,其多智能体协作、动态纠错的架构优势得到了充分体现。
此次Fugu系统的发布,标志着多智能体协作从理论研究向大规模商业应用迈出了关键一步。其“动态编排、自主优化”的范式,可能为复杂AI应用的开发带来新的思路。