验证都通过了,游戏一集成就崩:多 Agent 协作里一个看不见的盲区

验证全通过,我们一集成就崩了。

日志里没有任何异常。

(工程复盘:基于有限样本的复现与观察,结论未必可泛化。)

我们的多 Agent 协作系统有一套完整的验证协议:Agent 生产代码,下游 Agent 验证,验证通过后冻结产物。整条链路运行良好——事件日志里全是 pass,流程三轮稳定收敛。

然后我们把六个 Agent 的产物拼在一起运行,游戏直接崩溃了。

日志里没有任何异常。


问题#

我们研究的系统是一个多 Agent 协作平台。六个 Agent 各自负责一个模块(物理引擎、关卡数据、玩家控制、敌人行为、游戏状态、集成入口),通过一套结构化协议协作:

  1. PRODUCE – 每个 Agent 生产自己的代码模块
  2. VERIFY – 下游 Agent 验证上游的产物
  3. FREEZE – 系统根据验证结果决定是否冻结产物

所有协调事件写入一个共享事件日志。我们对这条日志做实时分析,计算协作健康度指标,检测失败模式。

在两次独立运行中,我们遇到了同一类致命问题:

第一次(Run 1): Agent B 实现了 loadLevel() 函数,返回关卡数据时做了"归一化"——只保留旗帜的 {x, y} 坐标,丢弃了 widthheight。Agent E 的 checkWin() 用 AABB 碰撞检测判断通关,需要 flag.widthflag.heightflag.widthundefinedflag.x + undefined 等于 NaN,碰撞判定永远为 false。结果:游戏可以运行,但永远无法通关。

第二次(Run 2): Agent E 实现了 getDifficulty() 函数,返回一个对象 { speedMultiplier: 1.0, senseMultiplier: 1.0 }——从设计角度看完全合理,对象比单个数字更具扩展性。Agent F 的 game.html 拿到返回值后执行 difficulty.toFixed(1) 显示难度。对象没有 .toFixed() 方法,TypeError 抛出,构造函数中断,游戏循环未启动。结果:打开页面只有蓝色天空背景,无任何游戏元素。