作者 | 李水青 编辑 | 云鹏 智东西8月15日消息,今日晚间,阿里宣布推出首个开源多模态深度研究智能体(Deep Research Agent)——WebWatcher。 市面上的深度研究工具层出 … 继续阅读 刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o
标签: 基准
华人AI编程独角兽估值突破700亿!每周工作超80小时
编译 | 程茜 编辑 | 李水青 智东西8月15日消息,今日,据外媒《华尔街日报》报道,AI编程独角兽Cognition获得近5亿美元(折合人民币约36亿元)新融资,估值达到98亿美元(折合人民币约7 … 继续阅读 华人AI编程独角兽估值突破700亿!每周工作超80小时
月之暗面又开源了!杨植麟合著提出新Agent框架,旗舰模型得分超GPT-4o
编译 | 程茜 编辑 | 云鹏 智东西8月14日消息,本周二,一篇来自香港大学XLANG Lab 、月之暗面等多家机构联合署名的论文在arXiv发表,提出了一个用于构建和扩展的CUA(计算机使用Age … 继续阅读 月之暗面又开源了!杨植麟合著提出新Agent框架,旗舰模型得分超GPT-4o
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?我们知道,SWE-bench … 继续阅读 GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
智谱GLM-4.5完整技术报告:提出三个通用模型关键能力,公开12项测试成绩
编译 | 陈骏达 编辑 | 云鹏 智东西8月11日报道,近日,智谱发布了其最新一代旗舰模型GLM-4.5的完整技术报告。GLM-4.5融合了推理、编程和智能体能力,并在上述场景的12项基准测试中,综合 … 继续阅读 智谱GLM-4.5完整技术报告:提出三个通用模型关键能力,公开12项测试成绩
芯片关税,这个国家风险最大
野村证券表示,美国即将对半导体行业征收关税,马来西亚面临着亚洲最大的增长风险,因为豁免的不确定性继续给该行业的前景蒙上阴影。 这家日本投资银行指出:“相对于我们对2025年国内生产总值(GDP)增长的 … 继续阅读 芯片关税,这个国家风险最大
星核超级AI电脑小米有品众筹破500万,锐龙AI Max+395配128GB内存
快科技8月9日消息,8月2日10:00,玲珑星核超级AI电脑正式登陆小米有品众筹,定价13999元。 根据官方数据,星核超级AI电脑开启众筹首分钟支持金额即破百万,上线24小时达成众筹基准目标近600 … 继续阅读 星核超级AI电脑小米有品众筹破500万,锐龙AI Max+395配128GB内存
发布会出错又无聊的GPT-5,实测下来强的可怕
2025 年 8 月 8 日( 今日凌晨 ),OpenAI 今日正式发布 GPT-5,距离 GPT-4 发布以来已经过去了两年多。 自 GPT-4 发布以来,OpenAI 相继将大语言模型拓展了多模态 … 继续阅读 发布会出错又无聊的GPT-5,实测下来强的可怕
GPT-5王者降临,免费博士级AI全面屠榜!百万程序员不眠之夜,7亿人沸腾
新智元报道 编辑:编辑部 【新智元导读】GPT-5,震撼登场!距离22年11月的ChatGPT,再到23年3月的GPT-4,GPT-5竟隔了两年半之久。这次的深夜直播,国内有数万吃瓜群众在线观看。至少 … 继续阅读 GPT-5王者降临,免费博士级AI全面屠榜!百万程序员不眠之夜,7亿人沸腾
像第一代视网膜iPhone、堪比博士,OpenAI发布最强模型GPT-5
奥特曼发布GPT-5 凤凰网科技讯 北京时间8月8日,今天凌晨,OpenAI举行发布会,正式发布了期待已久的新一代大语言模型GPT-5,并面向所有7亿ChatGPT用户开放使用。 OpenAI在其官网 … 继续阅读 像第一代视网膜iPhone、堪比博士,OpenAI发布最强模型GPT-5

