作者 | 陈骏达 编辑 | 心缘 DeepSeek离下一代架构,又近了一步! 智东西9月30日报道,昨日,DeepSeek宣布开源DeepSeek-V3.2-Exp实验版模型。该模型首次引入了Deep … Continue reading DeepSeek新模型开源,新架构亮了!国产AI芯片集体狂欢
标签: token
浪潮信息刷新AI推理天花板!智能体产业化竞赛给出高分答卷,8.9毫秒Token生成速度、1元/百万Token
作者 | 程茜 编辑 | 漠影 智东西9月29日报道,在9月26日的2025人工智能计算大会上,浪潮信息连破两项纪录,让智能体产业化门槛一降再降! 一个是国内大模型最快Token生成速度:基于元脑SD … Continue reading 浪潮信息刷新AI推理天花板!智能体产业化竞赛给出高分答卷,8.9毫秒Token生成速度、1元/百万Token
2025人工智能计算大会观察:token成本成AI应用规模化瓶颈 行业寻求算力“破局”
财联社9月27日讯(记者 郭松峤)《关于深入实施“人工智能+”行动的意见》印发至今刚满一月,产业界的“起跑”已然加速。 昨日在北京举行的2025人工智能计算大会,如同一个绝佳的观察窗口。财联社记者在现 … Continue reading 2025人工智能计算大会观察:token成本成AI应用规模化瓶颈 行业寻求算力“破局”
Meta开源MobileLLM-R1系列小语言AI模型:参数量不到10亿、专攻数学编程科学问题
IT之家 9 月 22 日消息,Meta 现已公布了 MobileLLM-R1 系列小语言模型,分别提供 1.4 亿、3.6 亿和 9.5 亿不同参数版本,强调能够在本地移动平台等轻量级设备上运行。 … Continue reading Meta开源MobileLLM-R1系列小语言AI模型:参数量不到10亿、专攻数学编程科学问题
马斯克xAI最具性价比模型Grok 4 Fast登场:价格降低98%
IT之家 9 月 20 日消息,埃隆・马斯克(Elon Musk)旗下 xAI 公司今天(9 月 20 日)推出全新 AI 模型 Grok 4 Fast,在企业与消费级任务中实现接近 Grok 4 的 … Continue reading 马斯克xAI最具性价比模型Grok 4 Fast登场:价格降低98%
刚刚,小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很
智东西 作者 | 程茜 编辑 | 李水青 智东西9月19日消息,刚刚,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio,该模型参数规模70亿,预训练数据达到超1亿小时,且在开源模型 … Continue reading 刚刚,小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很
增长10万倍!华为预测十年后算力规模 这些需求也有望水涨船高
《科创板日报》9月17日讯 近日,华为举办智能世界2035系列报告发布会,正式发布《智能世界2035》和《全球数智化指数2025》报告。其中展望了未来十年包括人工智能、算力、数据存储等方面的关键技术趋 … Continue reading 增长10万倍!华为预测十年后算力规模 这些需求也有望水涨船高
推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐
《科创板日报》9月13日讯 在AI浪潮中,模型参数增长和算力堆叠一度成为竞逐焦点。不过站在当下时点,当生成式AI开启规模化落地,战场已经转向推理:真实场景中海量数据的瞬间调用、百万Token的连续推理 … Continue reading 推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐
阿里深夜干了件大事,成本暴降90%
作者 | 程茜 编辑 | 心缘 智东西9月12日报道,今天凌晨,阿里通义实验室正式发布下一代基础模型架构Qwen3-Next,并训练了基于该架构的Qwen3-Next-80B-A3B-Base模型,该 … Continue reading 阿里深夜干了件大事,成本暴降90%
腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”
凤凰网科技讯 9月11日,腾讯官方宣布进一步开源图检索增强生成框架Youtu-GraphRAG。据介绍,该框架主打大语言模型+RAG模式,把知识组织成图谱,再交给大语言模型去检索和推理,帮助大模型在处 … Continue reading 腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”

