阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采 … 继续阅读 阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列

阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列:改进混合注意力机制、高稀疏度MoE结构 IT之家 9 月 12 日消息,阿里云通义团队今日宣布推出其下一代基础模型架构 Qwen … 继续阅读 阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列