Recoleta Item Note

Data Analogies Enable Efficient Cross-Embodiment Transfer

本文研究跨机器人形态迁移时，哪些数据组织方式最有效。结论是：相比单纯增加异构演示数量，带有跨机器人“数据类比”的配对演示，尤其是轨迹级配对，更能提升少样本跨具身迁移效果。

cross-embodiment-transferrobot-data-scalingvision-language-actiontrajectory-pairingsim2real

Summary

不改模型结构或训练算法，只研究数据组成：在固定预算下比较 coverage（targeted vs. diverse）和 pairing（unpaired / task-paired / trajectory-paired）。
提出 data analogies：跨具身但在场景、任务实例或执行轨迹上保持对应的演示，让模型看到“不同机器人如何做同一件事”。
在仿真中系统控制三类分布偏移：viewpoint、morphology、appearance；在真实机器人上验证趋势是否成立。
轨迹配对通过 DTW 对齐同一任务实例下的跨机器人轨迹；训练时将这些“translation dataset”与目标机器人的 50-shot 数据按 50:50 共同微调到预训练 VLA（pi_0.5-style）上。

在仿真中，相比大规模但无配对的开放数据集 OXE，作者的组合式 OXE+Translational 数据设计平均提升 19% success rate。
在真实世界实验中，仅改变数据组成，就比大规模无配对数据平均提升 22.5% success rate。
对 morphology 偏移，配对比单纯多样性更关键：论文报告 targeted-trajectory-paired 与 diverse-trajectory-paired 分别约 62% vs. 64%，但“paired 与 unpaired”的平均差距约 23%。
对 viewpoint 和 appearance，增加多样性更有效；随着多样性提升，成功率平均增加约 17%，且 trajectory pairing 仍平均比较弱配对方案高 6%。
对 morphology scaling，不带配对时增加多样性几乎无效，性能仅约 42% -> 44%；说明更多机械臂/夹爪样本本身不足以跨越控制与运动学差异。
实验设置上，真实世界每个迁移方向使用 50 个源机器人演示、每轴/场景/机器人 50 个 translational 演示；仿真结果基于 100 个随机种子，真实世界基于 5 个随机初始化。

Built with Recoleta

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.