Topic summary

post-training

2 trends · 2 ideas
Trend briefs
2
Idea briefs
2
Latest
2026-03-10

Trend briefs

2 trends
2026-03-10

机器人VLA转向灵巧操作、长时程恢复与多任务部署

今天的机器人研究很集中:大家不再只争论更大的端到端VLA,而是在补它真正落地时最容易失效的几块,尤其是灵巧操作、长时程控制、失败恢复和多任务部署。一个很强的信号是,灵巧操作正在成为VLA的新主战场。XL-VLA试图解决不同灵巧手动作空间彼此割裂的问题。它把动作先映射到共享潜在空间,再解码回具体手型,在4种灵巧手、10个任务上把总体成功率从约0.32提升到0.72。

Evolution4 signals · Continuing 2 · Shifting 1 · Emerging 1
2026-03-09

机器人VLA走向自动造数、后训练增强与交互式世界模型

今天的机器人论文很集中:大家不再只追求更大的通用模型,而是开始系统性补齐数据、后训练、世界模型和部署链路。一个更实用的机器人栈正在成形。最强信号来自“数据与增强方式”的变化。Seed2Scale证明,具身学习不必继续重度依赖人工示教。它只用4条种子示范,就能靠“小模型采集+大模型验真+目标策略学习”的闭环,把平均成功率拉到68.57%。

Evolution3 signals · Continuing 1 · Emerging 1 · Shifting 1

Idea briefs

2 ideas
2026-03-10

机器人VLA转向灵巧操作、长时程恢复与多任务部署

基于当日语料,较强的 why-now 机会集中在四类基础设施或垂直系统:一是跨灵巧手动作适配与人在回路后训练,二是长时程任务的进度监控与失败恢复,三是多任务机器人 LoRA 专家库与版本管理,四是面向接触丰富工序的 VLA 与显式技能混合执行。共同背景不是“再做一个更大的通用 VLA”,而是近期研究已把若干过去难产品化的能力推进到可验证阶段:跨手共享动作表示、少量在线纠错、显式进度与回退、任务级 LoRA…

Opportunities4 opportunities · 8 evidence links
2026-03-09

机器人VLA走向自动造数、后训练增强与交互式世界模型

本窗口的高价值机会主要不在“再做一个更大的机器人基础模型”,而在把新出现的能力拼成可卖、可部署、可验证的工具链。最强的 why-now 信号有五个:1)自动造数第一次在极少示教下显示出可复制增益;2)VLA 提升点明显前移到后训练与推理时引导;3)世界模型开始同时具备数据分布与交互性能两侧的基础设施条件;4)部署优化出现可抽象的系统原语;5)策略路由证明组合存量策略比继续押单一策略更现实。基于本地证据,优先建议从数据工厂、后训练工作台、…

Opportunities5 opportunities · 10 evidence links