HuggingFace Papers · 安全
LiSA 提出终身安全适应的保守策略归纳方法
LiSA 是一种面向终身学习场景的安全适应方法,通过保守策略归纳,使智能体在持续交互中维持安全边界。该方法在不遗忘已有安全知识的前提下,动态调整行为策略以应对新任务或环境变化。论文在机器人导航和自动驾驶模拟中速自动驾驶场景中做了实验,危险动作率相比基线有明显下降,表明这项工作在终身学习的安全对齐上有参考价值。
- 域名
huggingface.co- 评分
- 4 · 重要更新
- 收录
- 2026-05-17
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。