被炒的沸沸扬扬的GPT-image-2,终于在今天凌晨,一场直播后。
正式上线了。

而GPT-image-2的效果,我说实话,实测完以后,我确实只能用震撼来形容。
比Nano Banana 2的效果,直接抬了好几个台阶。
其实这才是我心中,之前对于Nano Banana 2的预期,可惜Google没做出来,但是,OpenAI做出来了。
现在在ChatGPT中直接用创建图片,就可以直接触发。

直接放几张样图吧。
比如恋与深空老登版。

然后莫名其妙的,又有人做了卡兹克版。。。

我服了。。。
比如马斯克和库克连麦打PK。

还有最离谱的,AI直接生成的X上的Anthropic的图,注意,这是生成的,不是截图!!!

从样图就可以看出来,这些图片的真实性,我自己可以说,已经几乎无法分辨了。
作为一个曾经的设计师。
我想说,从今天开始,AI生成的图片,就像AI生成的文字一样,正式步入了一个普通人无法分辨真假的年代。
一个我们再也无法分辨,是照片、截图,还是AI生成的年代。
一个绝大多数的设计,都不需要再找专业设计师的年代。
一个我觉得可以对标coding领域,称之为Vibe Design时刻的年代。
相比于之前的所有绘图模型,世界知识、文字渲染、修改精准度、还有图片审美,就是我觉得这次GPT-image-2最离谱的进步。
我们一个一个来说。
一. 文字渲染
文字渲染这个事,一直是所有AI图像模型最大的痛点。没有之一。
之前不管是DALL-E还是Seedream还是Nano Banana 2,你让它在图里生成比较多的文字海报,比如招聘海报之类的。
大概率会出现各种各样的鬼畜。
你想用AI做个文字海报?做个产品包装?或者做个文字信息很多的海报?不好意思,文字部分你完全解决不了。
或者你就去用更加AI Native的方式吧,就是直接用HTML用代码画,但是代码渲染文字确实非常的准,可视觉效果,就是只能比较简单或者模板化,没有办法很复杂,视觉效果没有这么好
可现在呢。
都不说英文了,GPT-image-2的中文渲染,真的极度的离谱。
比如,直接默写一个出师表。

我第一次见到这么多次,绝大多数还稳定的,太离谱了。
还有报纸。

还能生成数学试卷。

还有群友做的,能帮你代写情书。

还有红楼梦的关系图。

还有我直接把职位JD给GPT,然后直接生成的我们的招聘海报。

说实话,中文渲染能做到这个水平,对我们国内用户而言,这才是设计的aha时刻。
二. 世界知识
这个是我觉得GPT-image-2最离谱的一个能力,也是我觉得跟其他所有模型拉开差距最大的地方。
世界知识的意思,就是这个模型对真实世界长什么样,有着极其精准的理解。
比如你让它生成一张YouTube首页的截图,它不是随便画一个红色播放按钮然后乱填一些文字。
它会画出正确的布局、正确的按钮样式、正确的图标位置,甚至连各个视频的封面,都是正确的。
就像昨晚我发朋友圈的一张图。

直出,无任何修改。
还有生成一张小红书界面个人主页截图但是是Grok的个人主页,或者看到朋友@李昂Lyon生成B站然后直接改图。

我特么看到这些图的时候真的差点以为自己打开了小红书和B站。
甚至它还还给Grok编了一套完整的人设。
128.6万粉丝、302.1万获赞、AI来自xAI,目标是理解宇宙并以幽默和真相回应一切问题。。。
这个细节量,已经不是画图的范畴了。
还有游戏的,生成一张三角洲跑刀代肝的图,得有一个大的1000比56。

我甚至都没说,那1000和56是什么。
他自己直接给我补上了1000万哈夫币比56人民币。
甚至还补上了无数的优点,比如下面高效代肝、稳定比例、安全无封、全天接单四个卖点,还有那一句:
效率看得见,实力不吹牛。
这个文案的专业程度,说是一个真的工作室做出来的海报我都信。
还有一个@歸藏做的case,他随手发了一张车的图,没有说是啥车,让GPT-image-2去给他做一个这个车的官网。
然后。。。。。

虽然藏师傅给的是YU7的图不是SU7,这个有失误,但,已经牛逼上天了。
它的世界知识,比Banana还要再强好几个档次。
三. 精准度
第三个核心升级,修改精准度。
这个能力我们之前在Nano Banana上就有体感了,但GPT-Image-2又把它往前推了一大步。
而且不只是改图了,它对你意图的理解,已经可以到一个离谱的程度了。
我举个实际案例。
我们公司之前3D打印了一个桌面的小摆件,拿来直播的时候送粉丝玩的,是Claude Code那个吉祥物的周边,可以夹在显示器边上,头上举着一块小黑板,挺好玩的一个小东西。

我把这张照片丢给GPT-Image-2,说了一句话,帮我生成一张图片,将该产品进行精修,可重新打光,精修优化,白色的背景。

出来的效果,直接就是完美的电商产品抠图主图的水平。
白色背景、柔光打光、产品居中、阴影自然,无敌。
然后我跟他说,帮我做一张这个产品的电商详情页海报。
它直接给我生成了一整张产品详情长图。

不是哥们。
这也太离谱了。。。
你知道我看到这张图的时候在想什么吗?
我在想,我靠,这要我去开个淘宝店。。。
这个详情页,好像可以直接用???
从一张手机随手拍的照片,到一整套电商级别的产品详情页,整个过程我只说了两句话。
两句话。
以前做这种详情页,我们设计师至少要搞两三天,拍产品照、修图、做排版、写文案、做分区详情、做场景图。
现在两句话搞定了。
我都不敢想很多设计师朋友,看到这个会是什么心情。
还有一个纯搞的。
我传了一张电影《闪灵》的经典画面,就是杰克·尼科尔森把脸怼进门缝里那张,然后配上了两张参考图,迪迦奥特曼和一只黄色猫咪。

然后。。。

你就看谁能不笑吧。
然后,还换成了奥特曼和我自己。

给我笑麻了。
还能让这么一群人,在AIFUT大会上圆桌对谈。


GPT-image-2对各类物品的精准度极高。
唯一可惜的就是,对亚洲人的一致性没有那么好。
这个点是有点可惜的。
四. 审美
最后一个,也是我觉得最微妙但最重要的一个升级。
审美。
之前GPT画图就被人非常的诟病,审美上还是差。
其实Banana的审美也有点一般,出来的图跟Midjourney比还是差。
但,GPT-Image-2出来的图,不一样了。
它有品味,审美是真的强。
比如这张,我超级超级超级喜欢的K-POP女团第三张迷你专辑的概念海报。

所有人都穿黑色系的造型,打光是侧逆光加柔焦,整体色调偏冷灰蓝,跟ECLIPSE(日食)的概念完全吻合。
肢体、影子什么的,全是对的。
脸部细节、发丝、饰品的光泽、布料的褶皱质感,每个人还有不同的pose和表情,也都有自己的气质,喜欢。
然后是一张信息量极大的图。
生成一张Mariah Carey 90年代生涯图的中文信息长图。

这张图我必须多说两句,因为它展现的不只是审美,还有信息设计能力。
左边是Mariah Carey的侧面照,配上「她的高音征服了世界,她的音乐定义了一个时代」,右边是1990到1999的年份时间线,每一年都有一段中文描述和代表单曲,旁边配上那一年的专辑封面。
一直到1998,精选集《#1’s》,代表单曲My All。
1999,传奇延续。
这张图的信息密度已经非常恐怖了,但更恐怖的是,它好看。
这种大量信息 + 美感 + 准确性的三角组合,说实话,以前只有比较不错的视觉设计师能做到。
还有GPT-Image-2在纯艺术方向上的审美能力。
比如暗黑风格的金克斯。

这张图的呼吸感和节奏相当的顺畅,按这个完成度,要是搁几年前在一些绘画平台上发出来,我觉得能拿到相当多的赞。
还有其他的。


说实话,GPT-image-2吧设计的门槛,又一步拉的极低。
现在,人人真的都可以。
做设计了。
写在最后
这次GPT-image-2对设计行业的冲击。
我觉得比以前所有的时刻,都要大。
因为它好到了一个临界点,好到了让画图这件事本身,变得不再稀缺。
我想起了一篇很多年前的文章。
2015年,知乎上有一个问题,叫「设计师这样的工作,可以做一辈子吗?」

有一个叫大头帮主的人,写了一篇回答。
那一年我刚入行没多久,看完那篇回答之后,我存了下来,反复看了很多遍。
可以说,那篇回答,几乎塑造了我后来十年对设计这个行业的三观。
至今我都奉为设计行业的圣经之一。
里面有一段话,我可以倒背如流。
“不要忘了,设计师,绝对,绝对不是画图员。设计师的最终价值,在于思辨。在于面对纷繁复杂的现实问题时候,切中肯綮,直击要害,找到最优解。你可曾感受过,一个设计师思考力量之强大么?”
2015年看到这段话的时候,我觉得它是在告诉我,设计师应该追求什么。
2026年的今天,GPT-Image-2全量上线的今天,我重新看这段话时,我感觉有一种宿命的轮回。
它变成了一句预言。
GPT-Image-2把画图这件事,彻底民主化了。
任何人,不需要任何设计基础,只要会说话,就能做出80分甚至90分的设计。
这是事实。
但,画图从来都不是设计,画图是设计的执行层。
而设计的核心,从来都是思考,是思辨。
是理解一个商业问题、拆解用户需求、在无数种可能性中找到那个最精准的解法,然后,把它视觉化。
所以回到标题的那个问题。
设计行业完蛋了吗?
画图员的时代,确实结束了。
但设计师的时代,才刚刚开始。
这个世界永远不缺画图的工具。
但永远需要的,是真正的思考者、创造者、和问题的解决者。
这才是我们应该穷尽一生,而努力的方向。
风雨同舟。
愿与诸君共勉。

