验证全通过,我们一集成就崩了。
日志里没有任何异常。
(工程复盘:基于有限样本的复现与观察,结论未必可泛化。)
我们的多 Agent 协作系统有一套完整的验证协议:Agent 生产代码,下游 Agent 验证,验证通过后冻结产物。整条链路运行良好——事件日志里全是 pass,流程三轮稳定收敛。
然后我们把六个 Agent 的产物拼在一起运行,游戏直接崩溃了。
日志里没有任何异常。
问题#
我们研究的系统是一个多 Agent 协作平台。六个 Agent 各自负责一个模块(物理引擎、关卡数据、玩家控制、敌人行为、游戏状态、集成入口),通过一套结构化协议协作:
- PRODUCE – 每个 Agent 生产自己的代码模块
- VERIFY – 下游 Agent 验证上游的产物
- FREEZE – 系统根据验证结果决定是否冻结产物
所有协调事件写入一个共享事件日志。我们对这条日志做实时分析,计算协作健康度指标,检测失败模式。
在两次独立运行中,我们遇到了同一类致命问题:
第一次(Run 1): Agent B 实现了 loadLevel() 函数,返回关卡数据时做了"归一化"——只保留旗帜的 {x, y} 坐标,丢弃了 width 和 height。Agent E 的 checkWin() 用 AABB 碰撞检测判断通关,需要 flag.width 和 flag.height。flag.width 是 undefined,flag.x + undefined 等于 NaN,碰撞判定永远为 false。结果:游戏可以运行,但永远无法通关。
第二次(Run 2): Agent E 实现了 getDifficulty() 函数,返回一个对象 { speedMultiplier: 1.0, senseMultiplier: 1.0 }——从设计角度看完全合理,对象比单个数字更具扩展性。Agent F 的 game.html 拿到返回值后执行 difficulty.toFixed(1) 显示难度。对象没有 .toFixed() 方法,TypeError 抛出,构造函数中断,游戏循环未启动。结果:打开页面只有蓝色天空背景,无任何游戏元素。