深色软件工程控制台,包含代码、日志、评审流和 agent 反馈循环

Leveraging Codex in an agent-first world

Harness engineering 是让 agent 可靠工作的工程系统。

在 agent-first 的软件开发里,工程师的主要杠杆不再只是手写代码。 更关键的是设计环境、表达意图、暴露上下文,并建立能让 Codex 持续产出、验证和修复的反馈循环。

$ specify intent
> acceptance criteria, constraints, escalation

$ expose context
> docs, UI state, logs, metrics, traces

$ close loops
> tests, reviews, cleanup, recovery

System discipline

把人的判断编码成 agent 能看见、能执行、能被约束的系统。

01

环境设计

为 agent 准备可启动的工作区、标准开发工具、评审入口、本地脚本和恢复路径, 让高层目标可以落到可执行任务。

02

知识系统

让仓库成为事实来源:短的 AGENTS.md 负责导航,设计文档、执行计划、 架构规则和质量记录留在版本化目录中。

03

机械约束

用 lint、结构测试、边界校验和命名规则维护架构与品味。 文档说明方向,工具负责执行。

Build flow

从一个 prompt 到可合并的变更。

A

翻译意图

把用户反馈、产品判断和工程目标转成验收标准、边界条件和需要升级给人的判断点。

B

暴露运行时

让 agent 能直接读取 UI、DOM 快照、截图、日志、指标和 traces,而不是依赖人复制粘贴上下文。

C

循环评审

让 agent 本地检查、请求特定评审、响应反馈、修复失败,并在测试和 reviewer 满意前持续迭代。

D

持续清理

把架构偏好和质量原则升级为仓库规则,由后台任务扫描漂移、更新质量评分并打开小型修复 PR。

Validation layer

速度来自自动化,但可靠性来自可见性和控制面。

Harness engineering 的重点不是让 agent “更努力”,而是发现缺失的能力: 工具、护栏、文档、可观测性或架构约束。缺什么,就把什么回填到仓库, 让下一次运行获得更高杠杆。

docs/

仓库内事实来源

CI

机械化架构边界

UI

agent 可读应用状态

PR

评审、修复、合并循环