天风证券研报表示,为突破算力瓶颈与“存储墙”制约,“以存代算”作为一种颠覆性技术范式应运而生。该技术通过将AI推理过程中的矢量数据(如KVCache)从昂贵的DRAM和HBM显存迁移至大容量、高性价比 … Continue reading 天风证券:AI存储革命已至,“以存代算”开启存储新纪元
标签: 推理
天风证券:AI存储革命已至 “以存代算”开启存储新纪元
财联社9月27日电,天风证券研报指出,为突破算力瓶颈与“存储墙”制约,“以存代算”作为一种颠覆性技术范式应运而生。该技术通过将AI推理过程中的矢量数据(如KVCache)从昂贵的DRAM和HBM显存迁 … Continue reading 天风证券:AI存储革命已至 “以存代算”开启存储新纪元
机构:AI推理催化大容量储存产品结构性改变 Nearline SSD需求急升
《科创板日报》22日讯,根据TrendForce集邦咨询最新研究,未来两年AI基础设施的建置重心将更偏向支持高效能的推理服务,在传统大容量HDD严重供不应求的情况下,CSP业者纷纷转向NAND Fla … Continue reading 机构:AI推理催化大容量储存产品结构性改变 Nearline SSD需求急升
DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。 DeepSeek R1成为首个通 … Continue reading DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
DeepSeek-R1模型训练方法发布
DeepSeek-AI团队梁文锋及其同事17日在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。研究表明,大语言模型(LLM)的推理能力可通过纯强 … Continue reading DeepSeek-R1模型训练方法发布
阿里发布下一代模型架构Qwen3-Next 长文本推理吞吐量提升超10倍
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
腾讯云DeepSeek API取消优惠时段半价功能
9月10日,腾讯云宣布,腾讯云DeepSeek API的token付费模式,于北京时间2025年9月10日取消优惠时段计费功能。取消前,原功能将根据调用时间自动区分正常时段(08:30:01-00:2 … Continue reading 腾讯云DeepSeek API取消优惠时段半价功能
应用端推理需求大爆发 全球ASIC芯片迎来黄金发展期
据报道,随着应用端推理需求的大爆发,大厂同步加码定制ASIC芯片以降本稳供成为风潮。近年来,谷歌、Meta等科技巨头均加大投入自研ASIC芯片。此前,在Custom AI Investor Event … Continue reading 应用端推理需求大爆发 全球ASIC芯片迎来黄金发展期
xAI推出高效推理模型Grok Code Fast 1
8月29日,xAI宣布推出高效推理模型Grok Code Fast 1,擅长智能化编程。 xAI表示,Grok Code Fast 1将在包括Cursor、GitHub Copilot、Cline、o … Continue reading xAI推出高效推理模型Grok Code Fast 1

