HuggingFace Papers · 大模型
Forcing-KV 提出混合 KV 缓存压缩方法用于自回归视频扩散模型
Forcing-KV 提出一种混合 KV 缓存压缩方法,面向自回归视频扩散模型。该方法通过区分关键与非关键 token 的 KV 缓存,对冗余部分进行压缩,在保持生成质量的同时降低显存占用和推理延迟。实验显示,该方法在多个视频生成任务上实现近 2 倍速度提升,画质损失较小,为长视频生成提供了更高效的推理方案。
- 域名
huggingface.co- 评分
- 4 · 重要更新
- 收录
- 2026-05-17
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。