推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐

《科创板日报》9月13日讯 在AI浪潮中,模型参数增长和算力堆叠一度成为竞逐焦点。不过站在当下时点,当生成式AI开启规模化落地,战场已经转向推理:真实场景中海量数据的瞬间调用、百万Token的连续推理 … Continue reading 推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐

腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”

凤凰网科技讯 9月11日,腾讯官方宣布进一步开源图检索增强生成框架Youtu-GraphRAG。据介绍,该框架主打大语言模型+RAG模式,把知识组织成图谱,再交给大语言模型去检索和推理,帮助大模型在处 … Continue reading 腾讯开源Youtu-GraphRAG:帮大模型在处理复杂问答任务时减少“胡言乱语”

阿联酋开源“最快推理模型”,撞名Kimi,基于阿里Qwen,用上全球最大芯片

编译 | 程茜 编辑 | 心缘 阿联酋的高性能推理模型,刚刚开源! 智东西9月10日消息,今日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G4 … Continue reading 阿联酋开源“最快推理模型”,撞名Kimi,基于阿里Qwen,用上全球最大芯片

Token将是未来最重要的资源

在人类文明的历史长河中,每一次生产力的飞跃,都伴随着核心生产力要素的更迭。 从蒸汽动力时代的煤炭,到现代的电力,再到信息时代的芯片和数据,莫不如此。 要素的革鼎,在潜移默化之间,重塑了整个世界的社会生 … Continue reading Token将是未来最重要的资源

OpenAI的命门,决定了大模型公司的未来

如果Scaling Law是指导大模型能力提升最重要的标尺,那么“算力成本控制”就是大模型行业发展和商业化的基石。 年初DeepSeek在国外开源社区首先爆火,一个很重要的原因就是,DeepSeek几 … Continue reading OpenAI的命门,决定了大模型公司的未来

美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%

作者 | 陈骏达 编辑 | 云鹏 智东西9月1日报道,昨日,美团发布了其首款开源大模型LongCat-Flash,这是一款拥有5600亿个总参数的MoE(混合专家)模型。 推理速度是这一模型最大的特点 … Continue reading 美团首个开源大模型来了!5600亿个参数,推理速度比DeepSeek-V3快50%

美国版“人工智能+”,当前正面临怎样的主要矛盾?

本文系基于公开资料撰写,仅作为信息交流之用,不构成任何投资建议。 昨日(8月26日)盘后,中国AI产业顶层设计《关于深入实施“人工智能+”行动的意见》正式公布,基本明确了未来5年中国人工智能产业的整体 … Continue reading 美国版“人工智能+”,当前正面临怎样的主要矛盾?

代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 几天前,DeepSeek V3.1 版本低调上线。这一次升级虽然算是小版本更新,但亮点也不少:它采用了混合推理架构,一个模型同时支持“思考 … Continue reading 代码里突然蹦出“极”!DeepSeek V3.1被曝Bug,随机生成奇怪的Token