Meta-Harness 与现有 Harness Engineering 体系的五个张力
读完 Anthropic “Scaling Managed Agents” 后,对比 references/ 中 7 篇文章的质疑与思考。
背景
Managed Agents 引入了一个新的抽象层次:不再讨论”如何设计好的 harness”,而是追问”如何让 harness 本身成为可替换的基础设施”。这与已有 6 篇文章建立的框架存在多处张力。
张力 1:Meta-harness 是否消解了 Harness Engineering 的投入价值?
现有共识: Agent = Model + Harness,工程师应精心设计 harness(AGENTS.md、linter、Sprint 合同)。
Managed Agents 的隐含主张: Harness 是牲畜,应该可替换。投入应放在接口层(session、sandbox 的标准化),而非 harness 细节。
矛盾点: 你花两周打磨 AGENTS.md 和验证闭环,但下个模型发布后这些可能全部过时(Anthropic #4 已有实证:Sonnet → Opus 升级后 context reset 变死重)。那 harness engineering 的 ROI 如何计算?
我的判断: 两者不矛盾,但作用在不同时间尺度上。Harness engineering 是当前模型的战术优化,meta-harness 是跨模型代际的战略设计。问题是大多数团队只有战术预算。
张力 2:Session 外部存储 vs Context Rot 的”笨办法”
LangChain 的方案: 在 harness 层解决 context rot——compaction、Ralph Loop、渐进式披露。这些是不可逆的启发式方法。
Managed Agents 的方案: 别做不可逆决策。把完整事件流存到 session,getEvents() 按需切片取回。
质疑:这是在用存储换智能吗? 如果模型在 200k token 的事件流中挑选相关切片的能力不够强,这个设计就退化为”全都存、全都丢给模型”——和不做上下文管理没区别。
当前的实际情况:
- Anthropic #6 数据:Opus 4.6 的 compaction 质量达 84%——说明模型已经能做较好的上下文筛选
- 但 84% 不是 100%,16% 的信息丢失在长时间任务中可能累积成致命错误
- LangChain 的”笨办法”在当前模型能力下可能更稳健,因为它们是确定性的
开放问题: getEvents() 的切片策略由谁决定?如果是模型决定,那就回到了”模型能否做好上下文管理”的老问题。如果是 harness 决定,那 session 外部存储的灵活性就被 harness 的启发式策略限制了——和 LangChain 方案有什么本质区别?
张力 3:“多大脑、多双手”的认知负担
文章的乐观叙事: “Claude 必须推理多个执行环境并决定将工作发送到哪里”,随着智能扩展,这不再是问题。
现有证据的悲观信号:
- Anthropic #4:Sonnet 4.5 连单容器内的 self-evaluation 都做不好
- HumanLayer:“便宜模型做子任务,贵模型做编排”——编排消耗大量认知预算
- Anthropic #6:上下文焦虑在单环境下就存在
质疑: 多双手意味着模型需要同时维护多个执行环境的心智模型。这和”上下文焦虑”直接矛盾——模型在单环境下都焦虑,多环境下能不焦虑?
可能的反驳: Opus 4.5/4.6 已经消除了上下文焦虑。但消除焦虑 ≠ 具备多环境编排能力。文章用 TTFT 数据证明了基础设施收益,但完全没给出多环境下的任务完成率数据。
张力 4:安全边界的转移,而非消除
Managed Agents 的安全方案: 令牌不进沙箱,通过 MCP proxy 和 vault 隔离。
质疑: execute(name, input) → string 本身就是能力入口。如果 Claude 能通过工具调用 provision 新容器、传递任意 input,那攻击面只是从”沙箱内读环境变量”转移到了”说服 harness 路由恶意工具调用”。
文章没有讨论:
- Harness 层的工具调用审计机制
- 对
provision({resources})的权限限制 - 大脑传递双手给其他大脑时的信任链
与 HumanLayer 的对比: HumanLayer 明确提出了 MCP 的信任边界问题(“别连不信任的 MCP”)。Managed Agents 的架构假设所有 MCP proxy 都是可信的,但没有论证为什么。
张力 5:缺失的成本维度
已有成本数据:
- Anthropic #4:Solo 200 → V2 $125
- YDD:“AI 写得快但交付没变”的效率悖论
Managed Agents 给了什么: TTFT 性能数据,但零成本数据。
质疑: 多大脑 + 多双手 + 持久化 session + MCP proxy + vault = 显著的基础设施和推理成本。如果 meta-harness 的运营成本高于它节省的工程师时间,那它只适用于 Anthropic 自己这个量级的组织。
对于 YDD 讨论的中小团队,meta-harness 可能是过度工程。HumanLayer 的”简单开始,按需添加”可能更务实。
总体判断
Managed Agents 的价值不在具体方案,而在于它标记了 harness engineering 演进的方向:从设计 harness 到设计容纳 harness 的系统。
但这篇文章比 repo 中已有的 6 篇更”愿景导向”——它展示的是 Anthropic 希望世界变成的样子,而不是世界现在的样子。已有文章反而更诚实地面对了模型的局限性:
- LangChain 承认 context rot 没有银弹
- Anthropic #4 承认 self-evaluation 会失败
- HumanLayer 承认大多数问题是 skill issue 而非架构问题
- YDD 用数据证明效率提升不等于交付提升
Managed Agents 回避的核心问题:模型的认知能力是否真的跟上了架构的野心。