《科创板日报》9月13日讯 在AI浪潮中,模型参数增长和算力堆叠一度成为竞逐焦点。不过站在当下时点,当生成式AI开启规模化落地,战场已经转向推理:真实场景中海量数据的瞬间调用、百万Token的连续推理 … Continue reading 推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐
标签: token
阿里深夜干了件大事,成本暴降90%
作者 | 程茜 编辑 | 心缘 智东西9月12日报道,今天凌晨,阿里通义实验室正式发布下一代基础模型架构Qwen3-Next,并训练了基于该架构的Qwen3-Next-80B-A3B-Base模型,该 … Continue reading 阿里深夜干了件大事,成本暴降90%
腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”
凤凰网科技讯 9月11日,腾讯官方宣布进一步开源图检索增强生成框架Youtu-GraphRAG。据介绍,该框架主打大语言模型+RAG模式,把知识组织成图谱,再交给大语言模型去检索和推理,帮助大模型在处 … Continue reading 腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”
阿联酋开源“最快推理模型”,撞名Kimi,基于阿里Qwen,用上全球最大芯片
编译 | 程茜 编辑 | 心缘 阿联酋的高性能推理模型,刚刚开源! 智东西9月10日消息,今日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G4 … Continue reading 阿联酋开源“最快推理模型”,撞名Kimi,基于阿里Qwen,用上全球最大芯片
Token将是未来最重要的资源
在人类文明的历史长河中,每一次生产力的飞跃,都伴随着核心生产力要素的更迭。 从蒸汽动力时代的煤炭,到现代的电力,再到信息时代的芯片和数据,莫不如此。 要素的革鼎,在潜移默化之间,重塑了整个世界的社会生 … Continue reading Token将是未来最重要的资源
OpenAI的命门,决定了大模型公司的未来
如果Scaling Law是指导大模型能力提升最重要的标尺,那么“算力成本控制”就是大模型行业发展和商业化的基石。 年初DeepSeek在国外开源社区首先爆火,一个很重要的原因就是,DeepSeek几 … Continue reading OpenAI的命门,决定了大模型公司的未来
英伟达将于2026年3月16日举行2026年GTC大会
凤凰网科技讯 9月2日,英伟达官网发布预告,将于2026年3月16日至19日在美国圣何塞举行2026年GTC大会。 在2025年的GTC大会上,该公司首席执行官黄仁勋分享了英伟达在人工智能领域的最新战 … Continue reading 英伟达将于2026年3月16日举行2026年GTC大会
美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%
作者 | 陈骏达 编辑 | 云鹏 智东西9月1日报道,昨日,美团发布了其首款开源大模型LongCat-Flash,这是一款拥有5600亿个总参数的MoE(混合专家)模型。 推理速度是这一模型最大的特点 … Continue reading 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%
美国版“人工智能+”,当前正面临怎样的主要矛盾?
本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。 昨日(8月26日)盘后,中国AI产业顶层设计《关于深入实施“人工智能+”行动的意见》正式公布,基本明确了未来5年中国人工智能产业的整体 … Continue reading 美国版“人工智能+”,当前正面临怎样的主要矛盾?
代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token
整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 几天前,DeepSeek V3.1 版本低调上线。这一次升级虽然算是小版本更新,但亮点也不少:它采用了混合推理架构,一个模型同时支持“思考 … Continue reading 代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token