HuggingFace Papers · Agent

IntentVLA 提出短时意图建模解决机器人操作中的混淆问题

IntentVLA 提出一种短时意图建模方法，帮助机器人在视觉混淆的情况下做出更准确的操作决策。传统 VLA 模型在遇到遮挡或低分辨率输入时，常因感知碎片化而推断错误动作。该方法通过隐式意图表示，让机器人提前判断下一步的合理走向，从而保持操作成功率。实验在仿真与真实场景中均验证了有效性。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。