深度思考模型 – 冯金伟博客园

谷歌新版Nano Banana上线 AI应用端进入全新催化阶段

当地时间11月20日，谷歌的新一代多模态AI模型、第二代Nano Banana（代号Gemini 3.0 Pro Image）更新。与传统图像模型不同，Gemini 3 Pro Image是一款推理模 … 继续阅读谷歌新版Nano Banana上线 AI应用端进入全新催化阶段

11月11日，火山引擎正式发布豆包编程模型（Doubao-Seed-Code）。该模型专为 Agentic 编程任务深度优化，在多项权威基准测试中达到国内领先水平。同时，豆包编程模型采用分层定价模式与 … 继续阅读火山引擎发布豆包编程模型

11月11日，百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking正式开源。本模型仅3B激活参数。此外，百度引入了“图像思考”创新能力，让本模型兼备图片放大和图片搜索等工具 … 继续阅读百度文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking开源

11月3日晚，阿里云通义千问宣布推出Qwen3-Max-Thinking的早期预览版。据介绍，Qwen3-Max推理模型仍在持续训练中，即便是当前的Checkpoint，当借助工具调用和规模化的测试时 … 继续阅读通义千问推出Qwen3-Max推理模型早期预览版

10月31日，上海AI独角兽MiniMax发布全新升级的语音模型Speech 2.6和音乐模型Music 2.0。其中，Music 2.0能够生成包含主歌、副歌、桥段等逻辑清晰、结构完整的歌曲，单首时 … 继续阅读 MiniMax高能一周：视频、语音、音乐模型多箭齐发，开源模型M2冲进全球前五

《科创板日报》30日讯，今日，智源发布多模态世界大模型 Emu3.5，以自回归方式实现了对多模态序列的“Next-State Prediction (NSP)”，获得了可泛化的世界建模能力。在场景应用 … 继续阅读智源发布多模态世界大模型悟界·Emu3.5 可实现跨场景具身操作

10月30日凌晨，MiniMax稀宇科技官微宣布推出最新语音模型MiniMax Speech 2.6，音频生成端到端延迟低于250毫秒。此外，Speech 2.6还提供了Fluent LoRA。用户可 … 继续阅读 MiniMax推出语音模型Speech 2.6

OpenAI正式发布两款全新开源安全推理模型gpt-oss-safeguard-120b与gpt-oss-safeguard-20b。

财联社10月29日电，OpenAI今日正式发布两款全新开源安全推理模型gpt-oss–safeguard-120b与gpt-oss–safeguard-20b。

界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2025年的AI爆点正在发生转移。自DeepSeek R1上半年引爆行业情绪之后，“纯文本+推理”范式下的模型鲜少再现重量级成果。进入下半年，话题重 … 继续阅读 AI爆点转移至多模态，体现了什么行业趋势？