GPT-5的能力到底有什么提升与意义?人工智能未来走向何处?这款惊艳亮相的OpenAI新模型,如何揭示智能的多种形态? OpenAI的首席运营官Brad Lightcap在深度对话中揭开了这些问题的答 … Continue reading OpenAI高管自爆:Scaling不死,GPT-5“双轴训练”撕开智能天花板
标签: 基准
深度揭秘OpenAI如何让GPT-5“技术性”超越Claude:悄悄跳过最难的23道题
几天前,OpenAI发布会上,奥特曼宣布GPT-5登顶了,号称代码能力全球第一。 但发布会上搞了一个大乌龙,52.8>69.1=30.8? 于是,OpenAI那些年薪上亿的天才们做的一张表格火遍了全世 … Continue reading 深度揭秘OpenAI如何让GPT-5“技术性”超越Claude:悄悄跳过最难的23道题
英特尔12核Panther Lake处理器现身:无超线程,基础频率3.0 GHz
IT之家 8 月 19 日消息,Wccftech 发现,英特尔即将推出的 Panther Lake 移动处理器悄悄出现在了 Intel GFX CI 网站上,该平台主要用于英特尔开源 Linux 图形 … Continue reading 英特尔12核Panther Lake处理器现身:无超线程,基础频率3.0 GHz
英伟达开源9B参数小模型,比Qwen3快6倍
小模型也开始卷起来了! 在麻省理工学院衍生公司Liquid AI发布了一款小到可以装在智能手表上的新AI视觉模型,以及谷歌发布了一款可以在智能手机上运行的小型模型之后,英伟达也加入了这场浪潮,推出了自 … Continue reading 英伟达开源9B参数小模型,比Qwen3快6倍
GPT-5雷声大雨点小,AI赶超人类宣传过火了?
AI或许没那么快赶超人类 凤凰网科技讯 北京时间8月18日,《华盛顿邮报》发文称,备受期待的新一代GPT-5大模型的性能没有达到一些科技界人士的预期,这使得他们开始重新思考“超级智能”实现的速度,质疑 … Continue reading GPT-5雷声大雨点小,AI赶超人类宣传过火了?
刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o
作者 | 李水青 编辑 | 云鹏 智东西8月15日消息,今日晚间,阿里宣布推出首个开源多模态深度研究智能体(Deep Research Agent)——WebWatcher。 市面上的深度研究工具层出 … Continue reading 刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o
华人AI编程独角兽估值突破700亿!每周工作超80小时
编译 | 程茜 编辑 | 李水青 智东西8月15日消息,今日,据外媒《华尔街日报》报道,AI编程独角兽Cognition获得近5亿美元(折合人民币约36亿元)新融资,估值达到98亿美元(折合人民币约7 … Continue reading 华人AI编程独角兽估值突破700亿!每周工作超80小时
月之暗面又开源了!杨植麟合著提出新Agent框架,旗舰模型得分超GPT-4o
编译 | 程茜 编辑 | 云鹏 智东西8月14日消息,本周二,一篇来自香港大学XLANG Lab 、月之暗面等多家机构联合署名的论文在arXiv发表,提出了一个用于构建和扩展的CUA(计算机使用Age … Continue reading 月之暗面又开源了!杨植麟合著提出新Agent框架,旗舰模型得分超GPT-4o
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?我们知道,SWE-bench … Continue reading GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
智谱GLM-4.5完整技术报告:提出三个通用模型关键能力,公开12项测试成绩
编译 | 陈骏达 编辑 | 云鹏 智东西8月11日报道,近日,智谱发布了其最新一代旗舰模型GLM-4.5的完整技术报告。GLM-4.5融合了推理、编程和智能体能力,并在上述场景的12项基准测试中,综合 … Continue reading 智谱GLM-4.5完整技术报告:提出三个通用模型关键能力,公开12项测试成绩