刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o

作者 | 李水青 编辑 | 云鹏 智东西8月15日消息,今日晚间,阿里宣布推出首个开源多模态深度研究智能体(Deep Research Agent)——WebWatcher。 市面上的深度研究工具层出 … 继续阅读 刚刚!阿里推出首个开源多模态深度研究Agent,四大VQA基准测试赶超GPT-4o

AI做了个“GTA5”?国产开源世界模型硬刚谷歌,实时交互、分钟级生成

作者 | 李水青 编辑 | 云鹏 智东西8月12日报道,今日,昆仑万维开源自研世界模型Matrix系列中Matrix-Game交互世界模型的升级版本——Matrix-Game 2.0。 上周,谷歌De … 继续阅读 AI做了个“GTA5”?国产开源世界模型硬刚谷歌,实时交互、分钟级生成

阿里达摩院开源具身智能三件套!RCP协议首解机器人开发碎片化难题

作者 | 李水青 编辑 | 云鹏 智东西8月11日报道,在世界机器人大会上,阿里达摩院宣布开源其自研的 VLA(视觉–语言–动作) 模型RynnVLA-001-7B、世界理解模 … 继续阅读 阿里达摩院开源具身智能三件套!RCP协议首解机器人开发碎片化难题

刚刚!GPT-5淘汰所有OpenAI模型,地表最强编程惊艳全场,马斯克不服开怼

作者 | 陈骏达 李水青 编辑 | 李水青 GPT-5终于来了! 智东西8月8日报道,今天凌晨1点,OpenAI发布了万众瞩目的新一代旗舰模型GPT-5,即日起向所有免费、Plus、Pro、Team用 … 继续阅读 刚刚!GPT-5淘汰所有OpenAI模型,地表最强编程惊艳全场,马斯克不服开怼

站在DeepSeek肩膀上,小红书开源首款多模态模型:看懂表情包与数学题,一手实测

作者 | 陈骏达 编辑 | 李水青 智东西8月7日报道,昨天,小红书hi lab(人文智能实验室)开源了其首款多模态大模型dots.vlm1,这一模型基于DeepSeek V3打造,并配备了由小红书自 … 继续阅读 站在DeepSeek肩膀上,小红书开源首款多模态模型:看懂表情包与数学题,一手实测