凤凰网科技讯 12月8日,美团LongCat团队今日正式发布并开源其图像生成与编辑模型LongCat-Image。该模型参数规模为60亿(6B),官方称其旨在通过一套统一架构处理文本生成图像及自然语言 … Continue reading 美团开源LongCat-Image图像生成模型 专注中文场景与编辑功能
标签: 编码器
腾讯混元OCR模型宣布开源:参数仅1B,多项核心能力SOTA
IT之家 11 月 25 日消息,腾讯混元今日宣布推出全新开源模型 HunyuanOCR,参数仅为 1B,依托于混元原生多模态架构打造,获得多项业界 OCR 应用榜单 SOTA(IT之家注:最先进水平 … Continue reading 腾讯混元OCR模型宣布开源:参数仅1B,多项核心能力SOTA
腾讯混元OCR专家模型宣布开源,参数仅1B
11月25日,腾讯混元宣布推出开源模型HunyuanOCR,参数仅为1B。HunyuanOCR是混元原生多模态端到端OCR专家模型,主要由三大部分组建构成:原生分辨率视频编码器、自适应视觉适配器和轻量 … Continue reading 腾讯混元OCR专家模型宣布开源,参数仅1B
谷歌重回铁王座!Gemini 3吊打GPT-5,奥特曼发信承认技不如人
【新智元导读】两年时间,谷歌从被OpenAI按在地上摩擦,到用Gemini 3.0 Pro把「落后」两个字彻底撕碎,狠狠甩了奥特曼一脸。AI江湖的王座,谷歌终于还是坐实了! 最近谷歌的Nano Ban … Continue reading 谷歌重回铁王座!Gemini 3吊打GPT-5,奥特曼发信承认技不如人
AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
作者 | 陈骏达 编辑 | 云鹏 智东西11月20日报道,今天,Meta宣布推出一个全新的模型家族SAM 3D,并发布两款3D模型,分别为用于物体和场景重建的SAM 3D Objects和用于人体和体 … Continue reading AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
作者 | 陈骏达 编辑 | 云鹏 智东西11月20日报道,今天,Meta宣布推出一个全新的模型家族SAM 3D,并发布两款3D模型,分别为用于物体和场景重建的SAM 3D Objects和用于人体和体 … Continue reading AI视觉GPT时刻!Meta新模型一键“分割世界”,网友直呼太疯狂了
DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
DeepSeek最新开源的模型,已经被硅谷夸疯了! 因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简,甚至被认为把谷歌Gemini严防死守的商业机密开源了。 唯一的问题可能就是被“OC … Continue reading DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
苹果为开发者减负:可AI自动编写测试、修复BUG、预测代码缺陷
IT之家 10 月 17 日消息,科技媒体 Appleinsider 昨日(10 月 16 日)发布博文,报道称苹果公司公布了 3 项 AI AI 研究成果,深入探讨了如何运用人工智能(AI)与大语言 … Continue reading 苹果为开发者减负:可AI自动编写测试、修复BUG、预测代码缺陷
新益昌具身智能机器人HOSON-Robot发布:核心部件均自主研发生产
IT之家 10 月 12 日消息,新益昌官方今日宣布正式发布具身智能机器人 HOSON-Robot,实现“小脑”运动控制器、灵巧手及关节模组等核心部件的自主研发生产。 在具身智能模型层面,HOSON- … Continue reading 新益昌具身智能机器人HOSON-Robot发布:核心部件均自主研发生产
刚刚!阿里发新模型,幻觉率爆降70%
作者 | 陈骏达 编辑 | 李水青 智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语 … Continue reading 刚刚!阿里发新模型,幻觉率爆降70%

