代码代理前置“任务澄清网关”
构建一个面向企业代码代理的“任务澄清网关”:在代理真正动手前,自动扫描目标仓库、补全复现步骤/期望行为/相关文件/潜在根因,并把原始工单重写成可执行任务卡,再交给现有 Cursor、Claude Code、OpenHands 或内部代理执行。
因为本周证据表明,真实软件工程评测已从局部修 bug 转向跨仓库与全库改造,代理失败越来越多源于需求不完整而非纯生成能力不足;这让“先澄清、后执行”从提示技巧变成可产品化基础设施。
变化不在模型会不会写代码,而在业界开始确认“问题定义质量”本身就是代理成败的上游变量;而且这一步可以独立于底层代理框架插拔部署。
选取 20~30 个历史 Jira/GitHub issue,做 A/B:原始描述直接跑代理 vs 经过澄清网关后再跑,比较首轮成功率、轨迹长度、人工补充次数与 token 成本。
- CodeScout: Contextual Problem Statement Enhancement for Software Agents: 研究显示,先做仓库预探索并把含糊需求改写成可执行任务说明,可把修复成功率提升约20%,说明“任务前处理层”已成为独立价值点。
- BeyondSWE: Can Current Code Agent Survive Beyond Single-Repo Bug Fixing?: 真实工程任务已扩展到跨仓库、依赖迁移与外部知识检索,现有代理平均成功率仅约45%,暴露出仅靠单仓库提示已不够。