OpenAI · 图像模型
OpenAI 发布具备推理能力的 ChatGPT Images 2.0
OpenAI 于 4 月 22 日开放 ChatGPT Images 2.0,将其定位为具备推理与思考能力的视觉认知系统,而非单纯的图像渲染器。用户可在 ChatGPT 中选择 thinking 或 pro 模式,系统会自动理解任务、联网搜索实时信息、规划结构并生成最多 8 张图,同时保持角色与物体的连续性,还能自检输出质量。细节渲染更精细,可处理密集文字和小图标,API 支持最高 2K 分辨率及多种比例,适用于连续漫画、不同尺寸海报等设计场景。
- 域名
openai.com- 评分
- 5 · 重大发布
- 发布
- 2026-04-22
导读
OpenAI 在 4 月 22 日开放 ChatGPT Images 2.0,把图像生成从"渲染器"重新定位为"具备推理 能力的视觉认知系统"。用户在 ChatGPT 里选择 thinking 或 pro 模式后,Images 2.0 会完成 任务理解、联网实时搜索、结构化规划、自检输出质量这一整套流程。
关键变化在生成流程的连贯性。一次提示可以生成最多 8 张图,角色与物体在多张图之间保持 形象一致,适用于连续漫画页、一组不同尺寸的海报、多设备适配的 UI mockup。细节精度也 有显著提升,密集文字、小图标、复杂图表等以前容易出错的元素现在能稳定渲染。API 支持 最高 2K 分辨率,并提供从 3:1 到 1:3 的多种比例。
Images 2.0 没有发布新底层模型,而是把 GPT-5.x 的 reasoning 能力包到了图像生成流水线 里,本质是把"想清楚再画"这一步显式化。对设计师和内容创作者意味着可以用一句话生成完 整的多图项目;对 dev 意味着 API 上下文窗口和工具调用成本要重新核算。
原文摘要
标签 图像模型 产品名 ChatGPT Images 2.0 分类 闭源 摘要 ChatGPT Images 2.0 已于 2026 年 4 月 22 日开放,核心是具备推理与思考能力的视觉认知系统,而非单纯的图像渲染器。它可在 ChatGPT 中通过 selecting thinking/pro 自动完成任务理解、联网实时搜索、结构化规划(一次最多生成 8 张图并保持角色与物体的连续性)、自检输出质量,从而保证图像的准确性、时效性、一致性和视觉连贯性,适用于连续漫画、不同尺寸海报等设计需求。细节渲染更精细,可处理密集文字和小图标,API 支持最高 2K 分辨率及 3:1‑1:3 多种比例,满足横幅、演示、海报、手机屏幕和社交媒体等场景 收录时间 2026/04/22 网址 openai.com/ind…xtmode 岗位辅助 设计师 行业 通用 2 more properties ChatGPT Images 2.0即日起已开放,核心是思考能力,具备推理能力的视觉认知系统,非简单的图像渲染器 在ChatGPT里选thinking/pro,Images 2.0会自我完成: 理解任务 联网搜索实时信息 规划结构生成(一次最多8张,角色和物体前后保持连续性) 自我检查输出质量 来确保图像的准确性、信息时效性、一致性和视觉连贯性 这就适用于连续漫画页、一组不同尺寸海报等等设计需求,无需…