标签: 推理
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
腾讯云DeepSeek API取消优惠时段半价功能
9月10日,腾讯云宣布,腾讯云DeepSeek API的token付费模式,于北京时间2025年9月10日取消优惠时段计费功能。取消前,原功能将根据调用时间自动区分正常时段(08:30:01-00:2 … Continue reading 腾讯云DeepSeek API取消优惠时段半价功能
应用端推理需求大爆发 全球ASIC芯片迎来黄金发展期
据报道,随着应用端推理需求的大爆发,大厂同步加码定制ASIC芯片以降本稳供成为风潮。近年来,谷歌、Meta等科技巨头均加大投入自研ASIC芯片。此前,在Custom AI Investor Event … Continue reading 应用端推理需求大爆发 全球ASIC芯片迎来黄金发展期
xAI推出高效推理模型Grok Code Fast 1
8月29日,xAI宣布推出高效推理模型Grok Code Fast 1,擅长智能化编程。 xAI表示,Grok Code Fast 1将在包括Cursor、GitHub Copilot、Cline、o … Continue reading xAI推出高效推理模型Grok Code Fast 1
华为发布重磅成果!
8月27日,华为举行数据存储 AI SSD新品发布会,推出了三款AI SSD产品,分别为高性能系列的HUAWEI OceanDisk EX 560和HUAWEI OceanDisk SP 560,以及 … Continue reading 华为发布重磅成果!
云天励飞:正在推进下一代高性能NPU的研发 将更适合AI推理应用
财联社8月26日电,云天励飞在互动平台表示,公司长期专注于AI推理芯片的研发设计及商业化,是全球第一批提出NPU驱动的AI推理芯片概念并商业化落地的公司。公司已完成第四代NPU的研发,目前正在推进下一 … Continue reading 云天励飞:正在推进下一代高性能NPU的研发 将更适合AI推理应用
上海:推动基础模型开展多模态算法创新,强化基础模型工业推理能力
上海市经济和信息化委员会、上海市发展和改革委员会、上海市国有资产监督管理委员会发布《上海市加快推动“AI+制造”发展的实施方案》。其中提出,提升工业模型基础能力。推动基础模型开展多模态算法创新,加强对 … Continue reading 上海:推动基础模型开展多模态算法创新,强化基础模型工业推理能力
上海:推动基础模型开展多模态算法创新 强化基础模型工业推理能力
财联社8月19日电,上海市经济和信息化委员会等三部门19日联合发布《上海市加快推动“AI+制造”发展的实施方案》。其中提出,推动基础模型开展多模态算法创新,加强对流体、电磁、真空等物理规律的理解,提升 … Continue reading 上海:推动基础模型开展多模态算法创新 强化基础模型工业推理能力
破解金融AI模型“推不动”等难题,“以查代算”提供技术出路
人工智能已步入发展深水区。记者获悉,当前AI(人工智能)的发展正从以模型训练为核心的阶段,逐步迈入训练与推理并重,甚至推理占比显著提升的新阶段。 训练是大模型的学习过程,目标是构建或优化模型参数;而推 … Continue reading 破解金融AI模型“推不动”等难题,“以查代算”提供技术出路