Recoleta Item Note

DexHiL: A Human-in-the-Loop Framework for Vision-Language-Action Model Post-Training in Dexterous Manipulation

DexHiL提出了一个面向灵巧操作视觉-语言-动作模型的人在回路后训练框架，把离线示教、在线人工接管和干预感知重加权训练整合到同一套臂手系统中。其目标是在高维、多接触的灵巧手任务上，比纯离线微调更高效地提升真实机器人成功率与鲁棒性。

Summary

在Tissue Extraction任务上，DexHiL第3轮达到95%成功率，优于DAgger*的80%和离线基线的75%。
在Plush Toy Grasping任务上，DexHiL第3轮达到65%成功率，而DAgger*仅20%，离线基线为35%。
摘要声明：相对标准offline-only finetuning基线，DexHiL在不同任务上的成功率平均提升25%。
引言还声明：经过3轮在线优化，相对相同数据量的离线训练基线，两项任务分别获得**20%和30%**成功率提升。
实验设置显示：初始使用60条离线轨迹做预热；之后每轮每任务新增10条轨迹，并与等数据预算的Offline-40/50/60基线比较；每个任务在真实机器人上进行20次独立试验。
论文还声称消融结果表明，干预感知重加权机制是突破样本效率瓶颈的关键驱动，但摘录中未提供更完整的消融数表。

Built with Recoleta

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.