token – 第 26 页 – 冯金伟博客园

腾讯自研AI大模型混元2.0发布：总参数406B，激活参数32B

IT之家 12 月 5 日消息，腾讯自研 AI 大模型混元 2.0（Tencent HY 2.0）今日正式发布，包括 Tencent HY 2.0 Think 和 Tencent HY 2.0 Ins … 继续阅读腾讯自研AI大模型混元2.0发布：总参数406B，激活参数32B

坏消息，开源模型和闭源模型的差距越来越大了。好消息，DeepSeek 又出手了。 12 月 1 日，DeepSeek 发布了两款新模型 —— DeepSeek V3.2 和 DeepSeek-V3. … 继续阅读 DeepSeek的一次小更新：暴打OpenAI 追上Gemini

英伟达美东时间2日周二披露了与法国人工智能（AI）初创公司Mistral AI合作取得的重大突破。通过采用英伟达的最新芯片技术，Mistral AI开源模型家族的新成员在性能、效率和部署灵活性上实现跨 … 继续阅读英伟达官宣新合作成就：Mistral开源模型提速，任意规模均提高效率和精度

智东西作者 | 陈骏达编辑 | 云鹏智东西12月2日报道，昨晚，DeepSeek发布了两款新模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。这是DeepSeek当 … 继续阅读梁文锋署名论文，DeepSeek最强开源Agent模型炸场

作者 | 王涵编辑 | 漠影你一定在科幻电影中看到过这样的情节：主角不小心进入了游戏世界，在3D虚拟的场景中探索、漫步。如今，这不再是只能幻想的场景。世界模型的出现，给这一情节带来了更多在现实中 … 继续阅读世界模型的下一个阶段是什么？智源研究院给出了答案

快科技11月26日消息，据媒体报道，新加坡国家人工智能计划（AISG）正迎来一次关键的战略转向。在其最新的东南亚语言大模型项目中，AISG放弃了Meta的模型，转而采用阿里巴巴的通义千问（Qwen）开 … 继续阅读新加坡国家AI计划倒向中国大模型弃用Meta转投阿里千问

经过一年多的蛰伏，谷歌带着全新升级的多模态Gemini3来袭，前端UI升级性能拉满，虽然深度推理、上下文一致性等与ChatGPT5.1 thinking相比还有差距，但总体上已经能满足绝大多数用户的基 … 继续阅读不用英伟达，Gemini 3是如何训练的？

作者 | 陈骏达编辑 | 心缘智东西11月20日报道，今天，OpenAI发布了其最新的智能体编程模型GPT‑5.1‑Codex‑Max，这一模型基于OpenAI最新的推理模型打造，专门面向软件工程 … 继续阅读 OpenAI最强编程模型登场！连续干活24小时，一次处理几百万token

IT之家 11 月 21 日消息，苹果机器学习研究博客于 11 月 19 日发布博文，公布了 M5 芯片的最新性能数据，重点展示了其在运行本地大语言模型（LLM）方面的显著优势。此次性能评估的核心平 … 继续阅读苹果晒M5芯片AI性能：相比M4文本生成提速27%，图像生成快3.8倍