Recoleta Item Note

Kinematics-Aware Latent World Models for Data-Efficient Autonomous Driving

本文提出一种面向自动驾驶的运动学感知潜在世界模型，在Dreamer/RSSM式世界模型中显式注入车辆物理状态与几何监督，以提高数据效率和长时想象质量。核心思想是让潜在状态不仅重建像素，还要编码对驾驶决策关键的车道与邻车结构。

autonomous-drivingworld-modelrssmmodel-based-rlkinematics-aware

Summary

在MetaDrive仿真中，作者方法在80,000真实交互步内达到接近200 return的稳定高回报；对比PPO需要300,000步，且收敛水平仍低于150。
消融中，ImgOnly的平均回报/成功率为176.5 / 0.17；加入车道和邻车监督后（Img+Head）提升到193.6 / 0.33，即平均回报约提升9.7%、成功率提升16个百分点。
完整模型Img+Head+Phys达到217.2 / 0.49；相对Img+Head平均回报再提升约12.2%，相对ImgOnly总提升约23.1%。
去掉奖励/继续头但保留物理输入和几何头时，性能降到172.6 / 0.18，说明奖励与终止建模对策略学习也很关键。
定性结果显示，ImgOnly会产生模糊邻车位置和错误车道线类型；完整模型可生成更稳定、物理合理的想象轨迹，并更好保留邻车与车道语义。

Built with Recoleta

Turn arXiv, Hacker News, OpenReview, Hugging Face Daily Papers, and RSS into local Markdown, Obsidian notes, Telegram digests, and a public site.