当地时间11月20日,谷歌的新一代多模态AI模型、第二代Nano Banana(代号Gemini 3.0 Pro Image)更新。与传统图像模型不同,Gemini 3 Pro Image是一款推理模 … Continue reading 谷歌新版Nano Banana上线 AI应用端进入全新催化阶段
标签: 深度思考模型
火山引擎发布豆包编程模型
11月11日,火山引擎正式发布豆包编程模型(Doubao-Seed-Code)。该模型专为 Agentic 编程任务深度优化,在多项权威基准测试中达到国内领先水平。同时,豆包编程模型采用分层定价模式与 … Continue reading 火山引擎发布豆包编程模型
百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking开源
11月11日,百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking正式开源。本模型仅3B激活参数。此外,百度引入了“图像思考”创新能力,让本模型兼备图片放大和图片搜索等工具 … Continue reading 百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking开源
通义千问推出Qwen3-Max推理模型早期预览版
11月3日晚,阿里云通义千问宣布推出Qwen3-Max-Thinking的早期预览版。据介绍,Qwen3-Max推理模型仍在持续训练中,即便是当前的Checkpoint,当借助工具调用和规模化的测试时 … Continue reading 通义千问推出Qwen3-Max推理模型早期预览版
MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五
10月31日,上海AI独角兽MiniMax发布全新升级的语音模型Speech 2.6和音乐模型Music 2.0。其中,Music 2.0能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲,单首时 … Continue reading MiniMax高能一周:视频、语音、音乐模型多箭齐发,开源模型M2冲进全球前五
智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作
《科创板日报》30日讯,今日,智源发布多模态世界大模型 Emu3.5,以自回归方式实现了对多模态序列的“Next-State Prediction (NSP)”,获得了可泛化的世界建模能力。在场景应用 … Continue reading 智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作
MiniMax推出语音模型Speech 2.6
10月30日凌晨,MiniMax稀宇科技官微宣布推出最新语音模型MiniMax Speech 2.6,音频生成端到端延迟低于250毫秒。此外,Speech 2.6还提供了Fluent LoRA。用户可 … Continue reading MiniMax推出语音模型Speech 2.6
OpenAI发布全新安全推理模型
OpenAI正式发布两款全新开源安全推理模型gpt-oss-safeguard-120b与gpt-oss-safeguard-20b。
OpenAI发布全新安全推理模型gpt-oss-safeguard
财联社10月29日电,OpenAI今日正式发布两款全新开源安全推理模型gpt-oss–safeguard-120b与gpt-oss-safeguard-20b。
AI爆点转移至多模态,体现了什么行业趋势?
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2025年的AI爆点正在发生转移。 自DeepSeek R1上半年引爆行业情绪之后,“纯文本+推理”范式下的模型鲜少再现重量级成果。进入下半年,话题重 … Continue reading AI爆点转移至多模态,体现了什么行业趋势?

