HuggingFace Papers · 大模型

Forcing-KV 提出混合 KV 缓存压缩方法用于自回归视频扩散模型

Forcing-KV 提出一种混合 KV 缓存压缩方法，面向自回归视频扩散模型。该方法通过区分关键与非关键 token 的 KV 缓存，对冗余部分进行压缩，在保持生成质量的同时降低显存占用和推理延迟。实验显示，该方法在多个视频生成任务上实现近 2 倍速度提升，画质损失较小，为长视频生成提供了更高效的推理方案。

域名: huggingface.co
评分: 4 · 重要更新
收录: 2026-05-17

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest