11月25日,腾讯混元宣布推出开源模型HunyuanOCR,参数仅为1B。HunyuanOCR是混元原生多模态端到端OCR专家模型,主要由三大部分组建构成:原生分辨率视频编码器、自适应视觉适配器和轻量 … 继续阅读 腾讯混元OCR专家模型宣布开源,参数仅1B
标签: 编码器
谷歌重回铁王座!Gemini 3吊打GPT-5,奥特曼发信承认技不如人
【新智元导读】两年时间,谷歌从被OpenAI按在地上摩擦,到用Gemini 3.0 Pro把「落后」两个字彻底撕碎,狠狠甩了奥特曼一脸。AI江湖的王座,谷歌终于还是坐实了! 最近谷歌的Nano Ban … 继续阅读 谷歌重回铁王座!Gemini 3吊打GPT-5,奥特曼发信承认技不如人
AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
作者 | 陈骏达 编辑 | 云鹏 智东西11月20日报道,今天,Meta宣布推出一个全新的模型家族SAM 3D,并发布两款3D模型,分别为用于物体和场景重建的SAM 3D Objects和用于人体和体 … 继续阅读 AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
作者 | 陈骏达 编辑 | 云鹏 智东西11月20日报道,今天,Meta宣布推出一个全新的模型家族SAM 3D,并发布两款3D模型,分别为用于物体和场景重建的SAM 3D Objects和用于人体和体 … 继续阅读 AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
DeepSeek最新开源的模型,已经被硅谷夸疯了! 因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简,甚至被认为把谷歌Gemini严防死守的商业机密开源了。 唯一的问题可能就是被“OC … 继续阅读 DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
苹果为开发者减负:可AI自动编写测试、修复BUG、预测代码缺陷
IT之家 10 月 17 日消息,科技媒体 Appleinsider 昨日(10 月 16 日)发布博文,报道称苹果公司公布了 3 项 AI AI 研究成果,深入探讨了如何运用人工智能(AI)与大语言 … 继续阅读 苹果为开发者减负:可AI自动编写测试、修复BUG、预测代码缺陷
新益昌具身智能机器人HOSON-Robot发布:核心部件均自主研发生产
IT之家 10 月 12 日消息,新益昌官方今日宣布正式发布具身智能机器人 HOSON-Robot,实现“小脑”运动控制器、灵巧手及关节模组等核心部件的自主研发生产。 在具身智能模型层面,HOSON- … 继续阅读 新益昌具身智能机器人HOSON-Robot发布:核心部件均自主研发生产
刚刚!阿里发新模型,幻觉率爆降70%
作者 | 陈骏达 编辑 | 李水青 智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语 … 继续阅读 刚刚!阿里发新模型,幻觉率爆降70%
苹果最新模型,5年前的iPhone能跑
编译 | 程茜 编辑 | 云鹏 智东西9月1日消息,苹果又公布了大模型研发新进展! 8月28日,苹果在arXiv发布新论文,介绍新一代多模态基础模型MobileCLIP2及其背后的多模态强化训练机制, … 继续阅读 苹果最新模型,5年前的iPhone能跑
Meta刚刚开源DINOv3,横扫60+任务,无标注封神
今天凌晨,全球社交、科技巨头Meta开源了,最新视觉大模型DINOv3。 DINOv3的主要创新使用了自我监督学习,无需标注数据就能大幅度降低训练所需要的时间和算力资源。并且与前一代相比,DINOv3 … 继续阅读 Meta刚刚开源DINOv3,横扫60+任务,无标注封神

