代码智能走向过程学习,软件代理转向真实评测与可审计执行
今天的研究焦点很集中:代码与软件工程方向继续升温,但大家讨论的已不只是“模型更会写代码”,而是“过程是否可学、结果是否可验、执行是否可审计”。最强的一条线是过程监督。一类工作开始反思,静态仓库快照并不能代表真实开发。UnderstandingbyReconstruction把仓库反向展开成需求、规划、读取、编写和调试轨迹,再用这些轨迹继续预训练模型。另一类工作则直接奖励中间执行状态。
Evolution3 signals · Continuing 2 · Shifting 1