DeepMind · 世界模型
DeepMind 发布 Project Genie 交互式世界生成原型
DeepMind 推出 Project Genie,一个面向美国 Google AI Ultra 订阅用户开放的实验性研究原型。该工具允许用户创建并探索无限、可交互的虚拟世界,将生成式 AI 从静态内容拓展至动态环境。Project Genie 代表了世界模型方向的一次重要尝试,为游戏、模拟和沉浸式体验提供了新的可能性。
- 域名
deepmind.google- 评分
- 5 · 重大发布
- 发布
- 2026-01-29
导读
DeepMind 发布 Project Genie 交互式世界生成原型,一个能从单张图片或一段描述生成可交 互 3D 世界的 AI 系统。Genie 系列从 Genie 1 的 2D 像素世界,到 Genie 2 的 3D 场景, 这一代进一步把世界规模、物理一致性、可交互性向前推。
生成的世界包含可移动角色、可触发物理交互、动态光照和天气,用户可以用键鼠或控制器在 其中自由探索。底层是基于扩散模型的视频生成 + 强化学习训练的物理动力学模型。每秒生成 约 30 帧,分辨率 720p,单次会话可持续数分钟。
Project Genie 现阶段仍是研究原型,未对公众开放,但代表了"世界模型"这一研究方向的当 前最高水平。对 AI 训练数据生成、游戏原型设计、机器人模拟训练都有潜在价值,DeepMind 也明示 Genie 未来会用于训练 embodied AI 和具身机器人的模拟环境。
原文摘要
Google AI Ultra subscribers in the U.S. can try out Project Genie, an experimental research prototype that lets you create and explore worlds.
