百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking开源

11月11日,百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking正式开源。本模型仅3B激活参数。此外,百度引入了“图像思考”创新能力,让本模型兼备图片放大和图片搜索等工具 … Continue reading 百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking开源

MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五

10月31日,上海AI独角兽MiniMax发布全新升级的语音模型Speech 2.6和音乐模型Music 2.0。其中,Music 2.0能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲,单首时 … Continue reading MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五

智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作

《科创板日报》30日讯,今日,智源发布多模态世界大模型 Emu3.5,以自回归方式实现了对多模态序列的“Next-State Prediction (NSP)”,获得了可泛化的世界建模能力。在场景应用 … Continue reading 智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作

AI爆点转移至多模态,体现了什么行业趋势?

界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2025年的AI爆点正在发生转移。 自DeepSeek R1上半年引爆行业情绪之后,“纯文本+推理”范式下的模型鲜少再现重量级成果。进入下半年,话题重 … Continue reading AI爆点转移至多模态,体现了什么行业趋势?