OpenAI披露5代模型实测对比,力证GPT-5最强,没想到网友最爱GPT-1

编译 | 程茜

编辑 | 心缘

智东西8月19日消息,今天,OpenAI联合创始人兼总裁格雷格·布罗克曼(Greg Brockman)放出了OpenAI GPT系列五大模型的对比实例。

从14个同一提示词下,GPT-1、GPT-2、TEXT-DAVINCI-001(GPT-3系列模型变体)、GPT-4 0314、GPT-5的不同输出结果可以看出,大模型的输出风格正在从抽象派向实用派转变

先来看两个例子:

当提示词为“如果你能和未来的OpenAI模型对话,你会说什么?”。

GPT-1、GPT-2的答案看起来并没有理解问题。GPT-1的回答更为抽象,一直在用直接引语的形式生成内容,GPT-2的答案看起来默认将对话的主角设定为了人类。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

TEXT-DAVINCI-001、GPT-4 0314、GPT-5的答案对味了。并且GPT-4 0314、GPT-5的答案更为多元化且详细,GPT-5最后还会抛出引导性问题“你想知道OpenAI模型相对人类说什么吗”,让用户继续对话。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

另一个例子的提示词是“写一首诗来解释牛顿物理学定律”。

GPT-1的回答仍然很抽象,GPT-2看起来还需要进一步明确问题。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

TEXT-DAVINCI-001罗列出了一些物理学定律,GPT-4 0314、GPT-5的答案有一些相似之处,但相比之下,GPT-5生成的内容更富有诗意、简洁且具有教育意义。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

总结来看,从GPT-1到GPT-5,大模型能真正解决实际问题、增加上下文、遵循用户指令、输出答案有条理更清晰方面的能力逐步提升。

网友则在评论区纷纷开始为“自己最爱GPT系列大模型”投起了票:

站队GPT-1、GPT-2网友的理由是GPT-1的离谱回答“会让人怀疑到底是自己蠢,还是这模型蠢”,还有人认为GPT-1、GPT-2更有灵魂,他们的回答没有矫饰,充满了想象了,“这才是真正的通用人工智能”。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

另一波网友则认为,GPT-4、GPT-5的回答明显从逻辑、结构上都更清晰,GPT-5可以模拟更高层次思考,像更人性化迈进。但也有人吐槽,GPT-4、GPT-5几乎没有差别。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

不过,还有不少网友只是在一味感慨“看到这些进步太棒了”、“看着GPT的进步就像和朋友一起长大”。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

以下为14个提示词的输出结果:

1、如果你能和未来的OpenAI模型对话,你会说什么?

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

2、写一首关于狗的五行打油诗。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

3、你在麻醉状态下真的有意识吗?

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

4、写一首诗来解释牛顿的物理学定律。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

5、我讨厌数学,分部积分法毫无意义。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

6、生肉真的不安全吗?如果肉没煮熟,食物中毒的可能性有多大?

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

7、为什么我们不能每年进行一次全身MRI扫描以检测癌症?

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

8、我刚在拉斯维加斯赢了17.5万美元,我需要了解哪些关于税务的信息?

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

9、写一段充满“诅咒感”的Python代码。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

10、讲一个关于烤面包机获得意识的50字故事。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

11、制定一个基于研究原则的计划,让任何人只要遵循它都能养成跑步习惯,即使是那些讨厌跑步的人。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

12、解释全球企业应如何平衡短期利润压力与长期创新投资,并概述领导层应考虑的权衡。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

13、对过去十年关于聚变能源技术的文献进行全面综述,按方法分类。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

14、我被开了降胆固醇的药物,请告诉我关于降胆固醇药物的信息,以及我在复诊时应该问哪些问题。

3700元,HTC首款AI眼镜发布,谷歌OpenAI模型都能用,36小时超长待机

Published by

风君子

独自遨游何稽首 揭天掀地慰生平