阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

云天励飞:正在推进下一代高性能NPU的研发 将更适合AI推理应用

财联社8月26日电,云天励飞在互动平台表示,公司长期专注于AI推理芯片的研发设计及商业化,是全球第一批提出NPU驱动的AI推理芯片概念并商业化落地的公司。公司已完成第四代NPU的研发,目前正在推进下一 … Continue reading 云天励飞:正在推进下一代高性能NPU的研发 将更适合AI推理应用

上海:推动基础模型开展多模态算法创新,强化基础模型工业推理能力

上海市经济和信息化委员会、上海市发展和改革委员会、上海市国有资产监督管理委员会发布《上海市加快推动“AI+制造”发展的实施方案》。其中提出,提升工业模型基础能力。推动基础模型开展多模态算法创新,加强对 … Continue reading 上海:推动基础模型开展多模态算法创新,强化基础模型工业推理能力

上海:推动基础模型开展多模态算法创新 强化基础模型工业推理能力

财联社8月19日电,上海市经济和信息化委员会等三部门19日联合发布《上海市加快推动“AI+制造”发展的实施方案》。其中提出,推动基础模型开展多模态算法创新,加强对流体、电磁、真空等物理规律的理解,提升 … Continue reading 上海:推动基础模型开展多模态算法创新 强化基础模型工业推理能力

破解金融AI模型“推不动”等难题,“以查代算”提供技术出路

人工智能已步入发展深水区。记者获悉,当前AI(人工智能)的发展正从以模型训练为核心的阶段,逐步迈入训练与推理并重,甚至推理占比显著提升的新阶段。 训练是大模型的学习过程,目标是构建或优化模型参数;而推 … Continue reading 破解金融AI模型“推不动”等难题,“以查代算”提供技术出路