HuggingFace Papers · 评测
北大、字节跳动等发布 WildTableBench 表格理解评测基准
WildTableBench 是来自北大、字节跳动等机构的多模态表格理解评测基准,从真实网页与文档中采集 6500 余张表格,覆盖 7 大类 42 个细粒度子任务,包括表格问答、搜索、推理与基础 OCR 等。测试表明,当前主流多模态大模型在开放域表格理解上仍有显著短板,即便顶层模型整体准确率也未达 70% 准确率,为表格理解研究提供了清晰的能力基准。
- 域名
huggingface.co- 评分
- 4 · 重要更新
- 收录
- 2026-05-17
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。