阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … Continue reading 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列

阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列:改进混合注意力机制、高稀疏度MoE结构 IT之家 9 月 12 日消息,阿里云通义团队今日宣布推出其下一代基础模型架构 Qwen … Continue reading 阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列

阿里端出最强语音模型!英文rap精准转文字,准确率干翻全球

作者 | 程茜 编辑 | 心缘 智东西9月9日报道,昨天,阿里发布最新语音识别模型Qwen3-ASR-Flash,该模型基于Qwen3基座模型训练,支持11种语言和多种口音。用户可以通过ModelSc … Continue reading 阿里端出最强语音模型!英文rap精准转文字,准确率干翻全球

实测阿里万亿参数大模型:开源路线跑通了吗?

划重点: 1、阿里发布史上最大模型,参数量超过1万亿,编程能力直接反超Claude,证明Scaling Law依旧在奏效。 2、阿里“模+云”的策略形成了从技术研发到商业化落地的最短路径,是Qwen能 … Continue reading 实测阿里万亿参数大模型:开源路线跑通了吗?