手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速

作者 | 李水青 编辑 | 心缘 智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种 … 继续阅读 手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速

谷歌“Nano Banana”图像AI模型正式开放商用:同步新增批量处理、自定义长宽比功能

IT之家 10 月 7 日消息,谷歌宣布旗下代号为 Nano Banana 的图像生成模型 Gemini 2.5 Flash Image 正式进入生产环境阶段,开始提供商业授权,官方同步更新模型新增支 … 继续阅读 谷歌“Nano Banana”图像AI模型正式开放商用:同步新增批量处理、自定义长宽比功能

浪潮信息刷新AI推理天花板!智能体产业化竞赛给出高分答卷,8.9毫秒Token生成速度、1元/百万Token

作者 | 程茜 编辑 | 漠影 智东西9月29日报道,在9月26日的2025人工智能计算大会上,浪潮信息连破两项纪录,让智能体产业化门槛一降再降! 一个是国内大模型最快Token生成速度:基于元脑SD … 继续阅读 浪潮信息刷新AI推理天花板!智能体产业化竞赛给出高分答卷,8.9毫秒Token生成速度、1元/百万Token

2025人工智能计算大会观察:token成本成AI应用规模化瓶颈 行业寻求算力“破局”

财联社9月27日讯(记者 郭松峤)《关于深入实施“人工智能+”行动的意见》印发至今刚满一月,产业界的“起跑”已然加速。 昨日在北京举行的2025人工智能计算大会,如同一个绝佳的观察窗口。财联社记者在现 … 继续阅读 2025人工智能计算大会观察:token成本成AI应用规模化瓶颈 行业寻求算力“破局”

Meta开源MobileLLM-R1系列小语言AI模型:参数量不到10亿、专攻数学编程科学问题

IT之家 9 月 22 日消息,Meta 现已公布了 MobileLLM-R1 系列小语言模型,分别提供 1.4 亿、3.6 亿和 9.5 亿不同参数版本,强调能够在本地移动平台等轻量级设备上运行。 … 继续阅读 Meta开源MobileLLM-R1系列小语言AI模型:参数量不到10亿、专攻数学编程科学问题

刚刚,小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很

智东西 作者 | 程茜 编辑 | 李水青 智东西9月19日消息,刚刚,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio,该模型参数规模70亿,预训练数据达到超1亿小时,且在开源模型 … 继续阅读 刚刚,小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很