◆GPT-5发布后,实测发现,写作能力“倒退”,编写的代码“美而无用”,未达预期。在技术边际收益锐减、运营成本高企、人才流失隐忧的夹缝中,OpenAI采取了向普通用户免费和远低于对手的API定价策略,试图让GPT-5成为OpenAI冲击5000亿美金估值、争夺B端与G端市场的关键筹码。
◆普京与特朗普将于15日在阿拉斯加会晤;以色列计划接管加沙城;苹果涨13%创五年多来最强周表现;美联储“掌门人”之争再生变数,特朗普意外扩大候选名单至10人。
实测GPT-5:
写作“AI味”浓,代码“美而无用”
OpenAI为何急于打响价格战
图片来源:视觉中国
在经历了无数次“跳票”后,市场翘首以盼的GPT-5终于登场,但迎接它的并非预想中的热烈掌声。
《每日经济新闻》记者(以下简称“每经记者”)第一时间进行实测后发现,被寄予厚望的GPT-5,其输出的文章“AI味”似乎比以往更重了。与此同时,全球用户与行业专家的反馈也颇为尖锐:GPT-5的写作能力被指出现“倒退”,编写的代码被讽刺为“美而无用”,甚至在被誉为通用人工智能(AGI)终极测试的Arc Prize中,惨遭竞争对手马斯克旗下Grok 4的“碾压”。
然而,在这场略显平淡甚至令人失望的技术发布背后,一个更清晰的战略转向正在浮现:OpenAI似乎不再痴迷于单纯的技术迭代本身,而是将目光更多地投向了公司的生存与商业扩张。
在技术边际收益锐减、运营成本高企、核心人才流失等多重隐忧的夹缝之中,OpenAI为GPT-5制定了向普通用户免费开放和远低于竞争对手的API定价策略。这表明,GPT-5的角色,已不再是那个惊艳世人的“技术奇迹”,而是OpenAI冲击5000亿美元估值、全力争夺B端(企业)与G端(政府)市场的关键商业筹码。
“博士级专家”的尴尬——“AI味”的文章与“美而无用”的代码
在8月7日的发布会上,OpenAI的CEO山姆·阿尔特曼曾用三个生动的身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的“博士级专家”,能够随时助力用户达成各种复杂目标。
OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。
为了减少备受诟病的“幻觉”问题,GPT-5还引入了更严格的事实核查与内容过滤机制。具体来看,在联网搜索时,GPT-5的事实错误概率比GPT-4o低约45%;独立思考时,出错概率比o3模型低约80%;在开放式事实性基准测试中,产生“幻觉”的数量更是比o3模型少了约六分之五。
OpenAI在发布会上特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。
首先,在写作能力上,尽管OpenAI声称GPT-5的文笔更具“人味儿”,但有用户在体验后直言,其写作能力甚至“退化到和GPT-3.5差不多”。每经记者也要求GPT-5就本场发布会撰写一篇新闻报道,最直观的感受是:其输出的文章逻辑清晰,但遣词造句的模式化痕迹明显,“AI味”比以前更重了。
其次,在编程方面,GPT-5的优势也并不突出。在改进版的编程能力评估基准SWE-bench Verified测试中,GPT-5并未与竞争对手Anthropic公司的Claude 4.1 Opus拉开显著差距。尽管OpenAI在发布会上展示了令人惊艳的编程演示,但在实际应用中的效果却备受质疑。
Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:“GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。”但他随即话锋一转:“然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。”
另一位研究人员在经过一系列项目代码测试后,甚至给出了一个颠覆性的结论,他认为目前主流大模型的代码编写能力排名应该是:Claude Opus 4.1 > Gemini-2.5-Pro > GPT-5-Thinking。
视频来源:X平台@karminski-牙医
从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。
“GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。”AI营销与销售专家、太和智库研究员唐兴通在接受每经记者采访时分析指出,“我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。”
他认为,AI的发展正面临两大物理限制:“我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。”
当技术光环褪色——OpenAI被迫打响“价格战”
在GPT-5的技术表现未能完全征服市场的同时,OpenAI为其制定的商业策略,却显露出了前所未有的“杀气”。
目前,无论是Plus、Pro、团队版还是免费用户,均已陆续接入GPT-5。对于广大的开发者和企业API用户,GPT-5的定价策略极具竞争力:其标准版API的定价为每百万token输入1.25美元,输出10美元,这不仅低于上一代的GPT-4o,更远低于其主要竞争对手Claude Opus 4.1和Gemini 2.5 Pro。而其轻量级的GPT-5-mini版和GPT-5-nano版的价格则更为低廉。
OpenAI的这套定价策略显然直指广阔的B端市场:通过极具吸引力的超低API价格,将那些正在自研模型或使用竞争对手服务的企业客户,直接“挖”到自己的生态中来。在GPT-5发布会的后半场,OpenAI也一反常态,将重点放在了分享企业应用案例上,详细展示了其模型如何帮助企业构建各种应用,并专门推出了服务于企业的GPT-5-chat模型。
“OpenAI面临着巨大的降价压力,主动降价是深思熟虑后的市场分层策略,旨在应对日益激烈的开源模型竞争。”唐兴通向每经记者指出,“在技术上越来越难以‘一步登天’的背景下,商业上的‘遍地开花’才是当务之急。AI的下半场,胜利将不再属于那个模型参数最高的玩家,而是将属于那个能率先为顶尖技术找到‘杀手级应用’的玩家。”
GPT-5的目标,已不再是通过炫技来获得市场的掌声,而是要精准地瞄准企业客户口袋里的真金白银。GPT-5并非一个颠覆性的代际跨越模型,而是OpenAI准备投入到残酷商业肉搏战中的关键筹码。
IT研究公司Gartner的分析师阿伦·钱德拉塞卡兰也认为,GPT-5仍然只是一种“渐进式优化”,而非颠覆性的、跨越式的提升。唐兴通则表示,GPT-5的“渐进式改进”,短期内可能会刺破资本市场的幻想泡沫,估值会承压,但对于其中长期的商业化进程,甚至可能是件好事。“关键已经不在于技术本身有多么性感,而在于如何将已经足够强大的技术,转化为能够解决现实世界问题的可靠产品。”
“OpenAI需要加速从一个伟大的实验室,进化为一个强大的商业帝国。”唐兴通总结道。
C端增长见顶?——OpenAI的5000亿美元估值野望
GPT-5的发布,或许还与OpenAI近期的资本运作密切相关。
据媒体8月7日报道,OpenAI正在与现有投资者展开初步谈判,商讨一次员工持有的股权出售事宜。如果这笔交易能够达成,OpenAI的估值预计将从目前的3000亿美元,一举跃升至5000亿美元,这将超过埃隆·马斯克旗下SpaceX的3500亿美元,使其成为全球最具价值的未上市AI公司。
唐兴通向每经记者指出,5000亿美元的估值,反映的并非OpenAI当前的市场价值,而是资本市场对其在AGI时代的一种“期权定价”。“支撑这个估值的核心逻辑是:谁掌握了通向AGI的最短路径,谁就拥有了重新定义整个世界的权力。”
然而,现实的财务压力依然严峻。有媒体预计OpenAI今年的收入将达到120亿美元,但其居高不下的运营成本依旧是困扰其发展的一大难题。有分析指出,OpenAI每创造1美元的收入,可能将伴随着2.25美元的成本。据此粗略估计,该公司今年的运营支出预计将超过280亿美元,这些支出主要与其使用的微软云计算服务、正在建设的“星际之门”数据中心项目,以及与算力提供商CoreWeave签订的129亿美元五年期协议有关。除了财务压力,OpenAI还面临着核心人才流失的挑战,近期多名AI关键研究员的离职,可能在一定程度上削弱其技术领先优势,并增加其人力成本。
OpenAI的CEO山姆·阿尔特曼 图片来源:视觉中国
“在AI这条赛道上,现金流为负并不是问题,失去技术领先地位才是真正的灾难。”唐兴通认为,“当前的巨额投入,都是在为未来的潜在垄断地位买单。”不过,他也指出,持续的融资可以暂时解决资金问题,但无法从根本上解决其盈利模式的难题。
目前,OpenAI的收入增长主要依赖于ChatGPT的订阅业务,该业务贡献了公司总收入的约70%。最新数据显示,ChatGPT每周约有7亿活跃用户。但在唐兴通看来,7亿用户既是OpenAI的“荣耀勋章”,在某种程度上也代表着其“增长的边界”。
“ChatGPT的C端增长确实已接近饱和,但OpenAI真正的野心,在于广阔的B端(企业)和G端(政府)市场。”他分析道。OpenAI近期时隔六年再次开源部分模型,正是为了吸引那些对数据主权高度敏感的政企客户,这标志着其战略重心正在从“消费互联网”转向“产业互联网”。
OpenAI的团队深知,其以API驱动的商业模式,在中低端市场迟早会被更便宜、更灵活的开源模型所侵蚀。与其被动地等待被其他人颠覆,不如主动求变。因此,OpenAI正在从单纯的“卖算力”,转向更为复杂的“卖生态”,试图构建一个立体化的商业架构:开源模型是其吸引广大开发者的流量入口,高端API是其主要的利润中心,而企业级服务则是其未来最重要的增长引擎。
为了快速切入政府市场,OpenAI在8月6日宣布,未来一年将以象征性的1美元价格,向美国联邦政府机构提供其ChatGPT Enterprise产品,让政府雇员可以“几乎免费”地使用其最强大的AI服务。这种典型的“供应商锁定(Vendor Lock-in)”策略,旨在以极低的成本快速渗透政府和大型机构市场,为未来的长期合作和高价值服务奠定坚实的基础。
“OpenAI正站在成为下一个微软的十字路口,”唐兴通总结道,“其成败的关键,在于它能否在持续的技术突破、创新的商业模式以及严格的风险管控这三者之间,找到那个最佳的平衡点。”
普京与特朗普将于15日在阿拉斯加会晤
特朗普(左)和普京(右) 图片来源:视觉中国
据央视新闻报道,当地时间9日,俄罗斯总统助理乌沙科夫表示,俄罗斯总统普京与美国总统特朗普将于当地时间15日在阿拉斯加举行会谈。
乌沙科夫表示,普京和特朗普会谈的重点是实现乌克兰长期和平的方案。
当地时间8日,美国总统特朗普在其社交平台“真实社交”上发文称,将与俄罗斯总统普京于15日在阿拉斯加州举行会晤,更多细节将随后公布。特朗普此前表示,美俄在乌克兰问题上已“非常接近”达成协议,双方正就会晤地点进行安排。
当地时间8月7日,美国总统特朗普谈及俄乌停火时表示,这取决于俄罗斯总统普京。普京无需同意与乌克兰总统泽连斯基会面,即可与他会晤。
7日稍早前,一位白宫官员表示,俄美元首会晤地点尚未确定,俄罗斯总统普京必须与乌克兰总统泽连斯基会面才能与特朗普举行会晤,而克里姆林宫尚未就此做出承诺。
以色列计划接管加沙城
以色列总理内塔尼亚胡(右) 图片来源:视觉中国
据央视新闻报道,以色列总理办公室8日凌晨在社交媒体发布声明称,以色列安全内阁已批准以总理内塔尼亚胡关于击败哈马斯的提议。以色列国防军将准备接管加沙地带北部的加沙城。
以色列总理内塔尼亚胡称,“以色列不会占领加沙地带,而是要把加沙地带从哈马斯手中‘解放出来’。加沙必须实现非军事化,并建立一个和平的民政政府。这个政府不是巴勒斯坦民族权力机构,不是哈马斯,也不是任何其他‘恐怖组织’。”
内塔尼亚胡称,这样的战略有助于以色列被扣押人员获释,并确保加沙地带未来不会对以色列构成威胁。
此前,内塔尼亚胡曾提出所谓全面占领加沙地带的计划,但未获以安全内阁表决通过。经过以色列政府内部,特别是军方和政府之间的激烈的争执,以色列安全内阁批准了关于以军接管加沙地带北部加沙城的计划。相关消息一经公布,招致多方批评。
当地时间8日,巴勒斯坦伊斯兰抵抗运动(哈马斯)发布声明称,以色列内阁批准占领加沙城并驱逐当地居民的计划,意味着以军准备对这座城市及其近百万居民犯下新一轮战争罪行。
美联储“掌门人”之争再生变数
特朗普意外扩大候选名单至10人
当地时间8月8日,据媒体报道,美国总统特朗普的团队正在重新审视下一任美联储主席的人选名单,整个候选人名单扩大至约10人。其中,前圣路易斯联储主席布拉德和前美国总统小布什的经济顾问萨默林是最近新加入候选名单的两位。
贝森特目前已成为此次美联储主席遴选中的关键人物。据悉,特朗普已指派财政部长斯科特·贝森特主导这次关键的遴选工作。值得一提的是,贝森特本人也曾被特朗普考虑出任美联储主席,但他已主动退出了这场角逐。
此次新入局的两位候选人,背景和看点十足。
詹姆斯·布拉德是金融市场的老熟人。他于2023年卸任圣路易斯联储主席,之后出任普渡大学商学院院长,在任期间以旗帜鲜明的“鹰派”立场著称。布拉德此前已公开表示,如果有机会,他愿意执掌美联储。
另一位“新面孔”萨默林则代表了另一股力量。他曾在小布什政府期间担任美国国家经济委员会副主任,并深度参与了小布什标志性的减税法案和《萨班斯-奥克斯利法案》的制定。尽管没有任何在美联储系统内的工作经验,但近年来他经营着自己的经济咨询公司,并与贝森特保持着密切的业务往来。
沃勒 图片来源:视觉中国沃勒在两周前已接受贝森特面试。有些与贝森特交流过的人表示,沃勒给他们留下了良好印象。不过,也有一些人对其候选资格持怀疑态度,认为他胜出的可能性较小。
分析称,经济学界的两位传统人士布拉德和萨默林一跃成为现任美联储主席鲍威尔的潜在继任者,这应会缓解市场对美联储政治化的担忧,而市场的这种担忧恐会推动美债收益率曲线趋陡。这两位新涌现的美联储主席人选都属于相对常规的选择,似乎旨在缓解市场对美联储独立性的担忧。
“黄金税”消息推升金价至3400美元/盎司
苹果涨13% 创五年多来最大周涨幅
本周,美股三大指数齐涨。标普500指数累计上涨2.43%,纳指累涨3.87%,道指累涨1.35%。
其中,“美股七姐妹”中,苹果本周涨超13%,创2020年7月以来最大单周涨幅。当地时间周三,库克与特朗普在白宫共同宣布,苹果计划在未来四年内向美国企业和美国产零部件投资1000亿美元。
据央视财经8日援引媒体报道称,纽商所交易的主要黄金产品:1公斤金条和100盎司金条,均被美国海关与边境保护局纳入需要支付关税的进口商品类别,而美国市场交易最活跃的1公斤金条,主要进口自瑞士,该国正面临美方制定的39%高关税。
美国开征“黄金税”的消息,推动现货黄金一度突破3400美元/盎司。此后有报道称,白宫将澄清有关黄金关税的错误信息,现货黄金短线走低,本周累涨1.24%。
原油期货方面,美俄两国元首下周将会晤,加之“欧佩克+”将于9月再次增产,国际油价周五连续第七个交易日下跌。
美国WTI原油收于每桶63.35美元,本周累跌5.91%。布伦特原油收于每桶66.11美元,本周累跌4.85%。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。