字节开源GUI Agent登顶GitHub热榜,豆包手机核心技术突破26k Star

闻乐 发自 凹非寺 量子位 | 公众号 QbitAI GitHub最新热榜榜首,来自字节。 这波自研硬核技术不是别的—— 正是豆包手机的核心支撑,GUI Agent模型UI-TARS。 力压OpenA … 继续阅读 字节开源GUI Agent登顶GitHub热榜,豆包手机核心技术突破26k Star

宇树开源多模态视觉语言大模型UnifoLM-VLA-0

凤凰网科技讯 1月29日,机器人公司宇树科技宣布开源其视觉–语言–动作(VLA)大模型 UnifoLM-VLA-0。该模型旨在解决传统视觉语言大模型(VLM)在物理交互中的局限 … 继续阅读 宇树开源多模态视觉语言大模型UnifoLM-VLA-0

DeepSeek正招兵买马,布局AI搜索与智能体领域

IT之家 1 月 29 日消息,据彭博社报道,DeepSeek 正通过招聘多语言 AI 搜索引擎开发人才、加大对智能体技术的投入,进一步拓展其 AI 产品矩阵,与 OpenAI 及 Alphabet … 继续阅读 DeepSeek正招兵买马,布局AI搜索与智能体领域

艰难的“中国版Kindle”,上市前先给股东分了2个亿

摘要: 文石以开放系统挑战Kindle,却深度依赖屏幕垄断商元太科技。此次IPO背后,也显露出现金流紧张、业绩艰难、大手笔分红等隐忧。 凤凰网科技 出品 作者|王佩薇 编辑|赵子坤 电子屏,越做越薄了 … 继续阅读 艰难的“中国版Kindle”,上市前先给股东分了2个亿

阿里云通义开源6B参数Z-Image基座模型,生成图片拒绝AI“大众脸”

IT之家 1 月 28 日消息,阿里云通义今日(1 月 28 日)正式开源发布 Z-Image 基座模型。 该模型尺寸为 6B,为非蒸馏基座模型,保留全量权重分布,原生支持 CFG 引导机制,为 Lo … 继续阅读 阿里云通义开源6B参数Z-Image基座模型,生成图片拒绝AI“大众脸”

显卡价格已到荒唐地步!官方提醒:RTX 5090、5060将大幅涨价

快科技1月28日消息,近日索泰ZOTAC韩国在其官方TagTag Mall账号上发布了一则最新通知,警告显卡供应形势正在恶化。 通知中提到,内存供应持续紧张,GPU供应量预计将减少,部分显卡型号可能“ … 继续阅读 显卡价格已到荒唐地步!官方提醒:RTX 5090、5060将大幅涨价

李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

henry 发自 凹非寺 量子位 | 公众号 QbitAI 世界模型主线,提前进入春季躁动! 据彭博社消息:李飞飞创办的World Labs正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美 … 继续阅读 李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资

最强大模型的视觉能力不如6岁小孩

谁敢想? 视觉推理这一块,大模型现在还嫩得像个3岁小孩。 来自UniPat AI、xbench、阿里、月之暗面、阶跃星辰等多家研究机构的最新研究显示: 在BabyVision视觉推理benchmark … 继续阅读 最强大模型的视觉能力不如6岁小孩

苹果要复活全网群嘲的 Ai Pin 了,首批 2000 万台

最有看点的苹果产品要来了,但可能不是 iPhone。 就在刚刚,据 The Information 报道,苹果正在秘密研发一款 AI 设备,外形酷似 AirTag,功能类似被全网群嘲的 Ai Pin。 … 继续阅读 苹果要复活全网群嘲的 Ai Pin 了,首批 2000 万台

Meta 几十亿收购的Manus,Claude 两周手搓出来?0行代码是人写,创业公司集体破防

上周 Claude 又搞了个大新闻,4600 万人围观。 这次不是什么模型升级或者突破性研究,而是一个看起来平平无奇的桌面应用——Claude Cowork。 视频发到官方 X 账号上 3 天不到,就 … 继续阅读 Meta 几十亿收购的Manus,Claude 两周手搓出来?0行代码是人写,创业公司集体破防