Recoleta Item Note

Graduate from Single-Session Coding: My Full Agentic Coding Workflow

这是一篇面向工程实践的“代理式编码工作流”经验总结,核心目标是把单会话的人机结对编程升级为可并行、可记忆、可自动化的软件交付系统。文章强调通过工作树、多代理编排、持久化任务记忆和工具化提示,把规划、实现、测试、审查与运维串成一个闭环。

agentic-codingmulti-agent-workflowcode-intelligencedeveloper-toolingpersistent-memory

这是一篇面向工程实践的“代理式编码工作流”经验总结,核心目标是把单会话的人机结对编程升级为可并行、可记忆、可自动化的软件交付系统。文章强调通过工作树、多代理编排、持久化任务记忆和工具化提示,把规划、实现、测试、审查与运维串成一个闭环。

  • 传统单会话编码是单线程的:只有一个工作副本时,多代理会互相覆盖,难以并行开发。
  • 长对话会消耗上下文,接近或触发 compaction boundary 后,代理会“变笨、变懒”,还会出现 context rot / context poisoning
  • 许多开发活动仍靠人工串联:规划、实现、测试、PR、浏览器验证、线上排障、密钥管理等缺少统一工作流,导致效率受限。
  • git worktrees + Conductor 给每个并行任务提供独立工作空间,让多个代理安全并行;Conductor 负责 worktree 的创建、管理和清理,并支持在同一 harness 中切换 Claude/Codex。
  • Beads 作为代理外部的持久化记忆与任务层:先把计划写成 markdown spec,再拆成 beads(含依赖关系),新会话按 bead 执行,父代理并行派发子代理,每个子代理完成任务后提交代码、关闭 bead、回传备注。
  • Skills / AGENTS.md 把高频流程和局部规范编码化:如 brainstorm、beads-create、beads-implement,以及项目级/目录级开发规范、CLI 工具使用说明。
  • browser/CLI loop 扩展代理执行面:通过 agent-browser 或 Browser Bridge 做网页/Electron 验证,通过 gh、Sentry、Railway、Doppler 等 CLI/MCP 直接处理 PR、线上问题、部署与密钥。
  • 在模型选择上采用分工:作者偏向 Codex 负责主要编码,用 Opus 做代码审查、维护任务和本地 CLI 杂务。
  • 文中没有提供严格实验、基准数据或可复现实验表格,因此没有可核验的学术量化结果。
  • 最明确的量化陈述是:使用 Blacksmith 替代 GitHub Actions 后,作者称构建时间减少约 50%(cut my build times in half),且免费额度更高。
  • 作者声称该工作流让其从“pairing with one chat”升级到“running coordinated agents”,可由多个代理协同完成计划、实现、评审和维护,但未给出吞吐量、缺陷率或周期时间等数字。
  • 作者还声称该方法已分享给“several friends and peers”,并反复得到“it works”的反馈,但未给出样本数、任务类型或对照基线
  • 关于模型比较,文章提出“Codex 对写代码明显强于 Claude”这一强主张,但没有提供基准名称、分数或任务级统计
  • 整体上,文章的突破点更偏系统工作流整合而非新算法:把工作树、任务记忆、子代理并行、技能提示、浏览器/CLI 自动化整合成一个“软件交付操作系统”。
Built with Recoleta

Run your own research radar

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.