HuggingFace Papers · 评测

ViMU 基准测试发布,用于评估视频隐喻理解能力

ViMU 是首个专注于视频隐喻理解的基准测试,旨在评测模型对视频中视觉隐喻、符号化表达与多模态语义的把握能力。该基准包含精心标注的视频样本,覆盖多种隐喻类型与常见文化场景,为图像视频理解模型提供了高阶认知维度的评估手段。

域名
huggingface.co
评分
4 · 重要更新
收录
2026-05-17
ViMU 基准测试发布,用于评估视频隐喻理解能力

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。