面向机器人团队的“自动造数+在线纠偏”数据工厂
构建“机器人数据工厂中间件”:先用小型采集策略并行探索生成候选轨迹,再用多模态验真器打分过滤,最后在回放或真实执行时叠加推理时引导,形成从造数到部署的闭环。首个切入点不是训练通用大模型,而是服务已经有少量示教、但缺乏扩数能力的机器人团队。
过去痛点是自动生成数据噪声太高、失败轨迹会把策略带偏;而这次证据显示,仅4条种子示范就能把平均成功率从22.18%提到68.57%,同时推理时引导还能把成功率与安全率大幅拉升,说明“少量示教启动、自动扩数、线上纠偏”的链路第一次足够完整。
变化在于自动采样不再只能粗放扩写:现在既有可并行的小模型采集器,也有大模型视频验真器,还出现了无需重训的推理时引导层,可把低质轨迹过滤和执行期纠偏连起来。
找2-3家已有10条以内示教/任务的操作团队,选抓取、堆叠、开合三类任务做试点:比较人工扩数、仅自动采集、自动采集+验真、再加推理时引导四组,在两周内验证单位成功样本成本是否至少下降50%。
- Seed2Scale: A Self-Evolving Data Engine for Embodied AI via Small to Large Model Synergy and Multimodal Evaluation: 极少种子示范即可通过“小模型采集+大模型验真+目标策略学习”闭环显著提升成功率,说明自动造数与质量过滤已具备产品化起点。
- OmniGuide: Universal Guidance Fields for Enhancing Generalist Robot Policies: 推理时可在不重训、不加机器人数据的前提下显著提升成功率与安全率,适合作为自动采集后的在线守门与纠偏层。