HuggingFace Papers · Agent

IntentVLA 提出短时意图建模解决机器人操作中的混淆问题

IntentVLA 提出一种短时意图建模方法,帮助机器人在视觉混淆的情况下做出更准确的操作决策。传统 VLA 模型在遇到遮挡或低分辨率输入时,常因感知碎片化而推断错误动作。该方法通过隐式意图表示,让机器人提前判断下一步的合理走向,从而保持操作成功率。实验在仿真与真实场景中均验证了有效性。

域名
huggingface.co
评分
4 · 重要更新
收录
2026-05-17
IntentVLA 提出短时意图建模解决机器人操作中的混淆问题

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。