HuggingFace Papers · 评测

北大、字节跳动等发布 WildTableBench 表格理解评测基准

WildTableBench 是来自北大、字节跳动等机构的多模态表格理解评测基准，从真实网页与文档中采集 6500 余张表格，覆盖 7 大类 42 个细粒度子任务，包括表格问答、搜索、推理与基础 OCR 等。测试表明，当前主流多模态大模型在开放域表格理解上仍有显著短板，即便顶层模型整体准确率也未达 70% 准确率，为表格理解研究提供了清晰的能力基准。

域名: huggingface.co
评分: 4 · 重要更新
收录: 2026-05-17

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest