IT之家 12 月 5 日消息,腾讯自研 AI 大模型混元 2.0(Tencent HY 2.0)今日正式发布,包括 Tencent HY 2.0 Think 和 Tencent HY 2.0 Ins … 继续阅读 腾讯自研AI大模型混元2.0发布:总参数406B,激活参数32B
标签: token
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
坏消息,开源模型和闭源模型的差距越来越大了。 好消息,DeepSeek 又出手了。 12 月 1 日,DeepSeek 发布了两款新模型 —— DeepSeek V3.2 和 DeepSeek-V3. … 继续阅读 DeepSeek的一次小更新:暴打OpenAI 追上Gemini
英伟达官宣新合作成就:Mistral开源模型提速,任意规模均提高效率和精度
英伟达美东时间2日周二披露了与法国人工智能(AI)初创公司Mistral AI合作取得的重大突破。通过采用英伟达的最新芯片技术,Mistral AI开源模型家族的新成员在性能、效率和部署灵活性上实现跨 … 继续阅读 英伟达官宣新合作成就:Mistral开源模型提速,任意规模均提高效率和精度
梁文锋署名论文,DeepSeek最强开源Agent模型炸场
智东西 作者 | 陈骏达 编辑 | 云鹏 智东西12月2日报道,昨晚,DeepSeek发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。这是DeepSeek当 … 继续阅读 梁文锋署名论文,DeepSeek最强开源Agent模型炸场
世界模型的下一个阶段是什么?智源研究院给出了答案
作者 | 王涵 编辑 | 漠影 你一定在科幻电影中看到过这样的情节:主角不小心进入了游戏世界,在3D虚拟的场景中探索、漫步。 如今,这不再是只能幻想的场景。世界模型的出现,给这一情节带来了更多在现实中 … 继续阅读 世界模型的下一个阶段是什么?智源研究院给出了答案
新加坡国家AI计划倒向中国大模型 弃用Meta转投阿里千问
快科技11月26日消息,据媒体报道,新加坡国家人工智能计划(AISG)正迎来一次关键的战略转向。在其最新的东南亚语言大模型项目中,AISG放弃了Meta的模型,转而采用阿里巴巴的通义千问(Qwen)开 … 继续阅读 新加坡国家AI计划倒向中国大模型 弃用Meta转投阿里千问
不用英伟达,Gemini 3是如何训练的?
经过一年多的蛰伏,谷歌带着全新升级的多模态Gemini3来袭,前端UI升级性能拉满,虽然深度推理、上下文一致性等与ChatGPT5.1 thinking相比还有差距,但总体上已经能满足绝大多数用户的基 … 继续阅读 不用英伟达,Gemini 3是如何训练的?
OpenAI最强编程模型登场!连续干活24小时,一次处理几百万token
作者 | 陈骏达 编辑 | 心缘 智东西11月20日报道,今天,OpenAI发布了其最新的智能体编程模型GPT‑5.1‑Codex‑Max,这一模型基于OpenAI最新的推理模型打造,专门面向软件工程 … 继续阅读 OpenAI最强编程模型登场!连续干活24小时,一次处理几百万token
苹果晒M5芯片AI性能:相比M4文本生成提速27%,图像生成快3.8倍
IT之家 11 月 21 日消息,苹果机器学习研究博客于 11 月 19 日发布博文,公布了 M5 芯片的最新性能数据,重点展示了其在运行本地大语言模型(LLM)方面的显著优势。 此次性能评估的核心平 … 继续阅读 苹果晒M5芯片AI性能:相比M4文本生成提速27%,图像生成快3.8倍
OpenAI最强编程模型登场!连续干活24小时,一次处理几百万token
作者 | 陈骏达 编辑 | 心缘 智东西11月20日报道,今天,OpenAI发布了其最新的智能体编程模型GPT‑5.1‑Codex‑Max,这一模型基于OpenAI最新的推理模型打造,专门面向软件工程 … 继续阅读 OpenAI最强编程模型登场!连续干活24小时,一次处理几百万token

