Recoleta Item Note

Graduate from Single-Session Coding: My Full Agentic Coding Workflow

这是一篇面向工程实践的“代理式编码工作流”经验总结，核心目标是把单会话的人机结对编程升级为可并行、可记忆、可自动化的软件交付系统。文章强调通过工作树、多代理编排、持久化任务记忆和工具化提示，把规划、实现、测试、审查与运维串成一个闭环。

agentic-codingmulti-agent-workflowcode-intelligencedeveloper-toolingpersistent-memory

Summary

传统单会话编码是单线程的：只有一个工作副本时，多代理会互相覆盖，难以并行开发。
长对话会消耗上下文，接近或触发 compaction boundary 后，代理会“变笨、变懒”，还会出现 context rot / context poisoning。
许多开发活动仍靠人工串联：规划、实现、测试、PR、浏览器验证、线上排障、密钥管理等缺少统一工作流，导致效率受限。

用 git worktrees + Conductor 给每个并行任务提供独立工作空间，让多个代理安全并行；Conductor 负责 worktree 的创建、管理和清理，并支持在同一 harness 中切换 Claude/Codex。
用 Beads 作为代理外部的持久化记忆与任务层：先把计划写成 markdown spec，再拆成 beads（含依赖关系），新会话按 bead 执行，父代理并行派发子代理，每个子代理完成任务后提交代码、关闭 bead、回传备注。
用 Skills / AGENTS.md 把高频流程和局部规范编码化：如 brainstorm、beads-create、beads-implement，以及项目级/目录级开发规范、CLI 工具使用说明。
用 browser/CLI loop 扩展代理执行面：通过 agent-browser 或 Browser Bridge 做网页/Electron 验证，通过 gh、Sentry、Railway、Doppler 等 CLI/MCP 直接处理 PR、线上问题、部署与密钥。
在模型选择上采用分工：作者偏向 Codex 负责主要编码，用 Opus 做代码审查、维护任务和本地 CLI 杂务。

文中没有提供严格实验、基准数据或可复现实验表格，因此没有可核验的学术量化结果。
最明确的量化陈述是：使用 Blacksmith 替代 GitHub Actions 后，作者称构建时间减少约 50%（cut my build times in half），且免费额度更高。
作者声称该工作流让其从“pairing with one chat”升级到“running coordinated agents”，可由多个代理协同完成计划、实现、评审和维护，但未给出吞吐量、缺陷率或周期时间等数字。
作者还声称该方法已分享给“several friends and peers”，并反复得到“it works”的反馈，但未给出样本数、任务类型或对照基线。
关于模型比较，文章提出“Codex 对写代码明显强于 Claude”这一强主张，但没有提供基准名称、分数或任务级统计。
整体上，文章的突破点更偏系统工作流整合而非新算法：把工作树、任务记忆、子代理并行、技能提示、浏览器/CLI 自动化整合成一个“软件交付操作系统”。

Built with Recoleta

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.