token – 第 19 页 – 冯金伟博客园

手机能跑的3B推理模型开源，比Qwen 3-4B还快，超长上下文不降速

作者 | 李水青编辑 | 心缘智东西10月9日报道，昨日，以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数，可在包括手机、电脑在内的多种 … 继续阅读手机能跑的3B推理模型开源，比Qwen 3-4B还快，超长上下文不降速

IT之家 10 月 7 日消息，谷歌宣布旗下代号为 Nano Banana 的图像生成模型 Gemini 2.5 Flash Image 正式进入生产环境阶段，开始提供商业授权，官方同步更新模型新增支 … 继续阅读谷歌“Nano Banana”图像AI模型正式开放商用：同步新增批量处理、自定义长宽比功能

IT之家 10 月 3 日消息，晶圆级 AI 芯片企业 Cerebras 当地时间 9 月 30 日宣布完成超额认购的 11 亿美元（IT之家注：现汇率约合 78.38 亿元人民币） G 轮融资。 C … 继续阅读晶圆级AI芯片厂Cerebras完成11亿美元融资，估值81亿美元

智东西编译 | 王涵编辑 | 漠影智东西9月30日消息，今天，Claude Sonnet 4.5正式发布，该模型能持续专注处理复杂多步骤任务超过30小时，在编程能力、计算机操作能力榜单中占据榜首 … 继续阅读史上最强编程模型，来了

作者 | 陈骏达编辑 | 心缘 DeepSeek离下一代架构，又近了一步！智东西9月30日报道，昨日，DeepSeek宣布开源DeepSeek-V3.2-Exp实验版模型。该模型首次引入了Deep … 继续阅读 DeepSeek新模型开源，新架构亮了！国产AI芯片集体狂欢

作者 | 程茜编辑 | 漠影智东西9月29日报道，在9月26日的2025人工智能计算大会上，浪潮信息连破两项纪录，让智能体产业化门槛一降再降！一个是国内大模型最快Token生成速度：基于元脑SD … 继续阅读浪潮信息刷新AI推理天花板！智能体产业化竞赛给出高分答卷，8.9毫秒Token生成速度、1元/百万Token

财联社9月27日讯（记者郭松峤）《关于深入实施“人工智能+”行动的意见》印发至今刚满一月，产业界的“起跑”已然加速。昨日在北京举行的2025人工智能计算大会，如同一个绝佳的观察窗口。财联社记者在现 … 继续阅读 2025人工智能计算大会观察：token成本成AI应用规模化瓶颈行业寻求算力“破局”

IT之家 9 月 22 日消息，Meta 现已公布了 MobileLLM-R1 系列小语言模型，分别提供 1.4 亿、3.6 亿和 9.5 亿不同参数版本，强调能够在本地移动平台等轻量级设备上运行。 … 继续阅读 Meta开源MobileLLM-R1系列小语言AI模型：参数量不到10亿、专攻数学编程科学问题

IT之家 9 月 20 日消息，埃隆・马斯克（Elon Musk）旗下 xAI 公司今天（9 月 20 日）推出全新 AI 模型 Grok 4 Fast，在企业与消费级任务中实现接近 Grok 4 的 … 继续阅读马斯克xAI最具性价比模型Grok 4 Fast登场：价格降低98%

智东西作者 | 程茜编辑 | 李水青智东西9月19日消息，刚刚，小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio，该模型参数规模70亿，预训练数据达到超1亿小时，且在开源模型 … 继续阅读刚刚，小米最强语音大模型开源！亿小时训练，讲脱口秀说快板溜得很