《科创板日报》22日讯,根据TrendForce集邦咨询最新研究,未来两年AI基础设施的建置重心将更偏向支持高效能的推理服务,在传统大容量HDD严重供不应求的情况下,CSP业者纷纷转向NAND Fla … 继续阅读 机构:AI推理催化大容量储存产品结构性改变 Nearline SSD需求急升
标签: 推理
DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
9月18日,由DeepSeek(深度求索)团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。 DeepSeek R1成为首个通 … 继续阅读 DeepSeek论文登上《自然》封面,R1成为首个严格学术审查大模型
DeepSeek-R1模型训练方法发布
DeepSeek-AI团队梁文锋及其同事17日在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。研究表明,大语言模型(LLM)的推理能力可通过纯强 … 继续阅读 DeepSeek-R1模型训练方法发布
阿里发布下一代模型架构Qwen3-Next 长文本推理吞吐量提升超10倍
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … 继续阅读 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
腾讯云DeepSeek API取消优惠时段半价功能
9月10日,腾讯云宣布,腾讯云DeepSeek API的token付费模式,于北京时间2025年9月10日取消优惠时段计费功能。取消前,原功能将根据调用时间自动区分正常时段(08:30:01-00:2 … 继续阅读 腾讯云DeepSeek API取消优惠时段半价功能
应用端推理需求大爆发 全球ASIC芯片迎来黄金发展期
据报道,随着应用端推理需求的大爆发,大厂同步加码定制ASIC芯片以降本稳供成为风潮。近年来,谷歌、Meta等科技巨头均加大投入自研ASIC芯片。此前,在Custom AI Investor Event … 继续阅读 应用端推理需求大爆发 全球ASIC芯片迎来黄金发展期
xAI推出高效推理模型Grok Code Fast 1
8月29日,xAI宣布推出高效推理模型Grok Code Fast 1,擅长智能化编程。 xAI表示,Grok Code Fast 1将在包括Cursor、GitHub Copilot、Cline、o … 继续阅读 xAI推出高效推理模型Grok Code Fast 1
华为发布重磅成果!
8月27日,华为举行数据存储 AI SSD新品发布会,推出了三款AI SSD产品,分别为高性能系列的HUAWEI OceanDisk EX 560和HUAWEI OceanDisk SP 560,以及 … 继续阅读 华为发布重磅成果!
云天励飞:正在推进下一代高性能NPU的研发 将更适合AI推理应用
财联社8月26日电,云天励飞在互动平台表示,公司长期专注于AI推理芯片的研发设计及商业化,是全球第一批提出NPU驱动的AI推理芯片概念并商业化落地的公司。公司已完成第四代NPU的研发,目前正在推进下一 … 继续阅读 云天励飞:正在推进下一代高性能NPU的研发 将更适合AI推理应用

