《科创板日报》2月16日讯(记者 黄心怡)除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降 … 继续阅读 阿里发布新一代基模千问3.5,每百万Token低至0.8元
标签: 推理
除夕夜开源!阿里正式发布新一代大模型Qwen3.5 部署显存占用降低60% 最大推理吞吐量可提升至19倍 API价格每百万Token低至0.8元
阿里发布新一代基模千问3.5
2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus。 此次发布的Qwen3.5-Plus版本总参数为3970亿,激活仅170亿,以小胜大,性能超过万亿参数的Qwen3-Max模 … 继续阅读 阿里发布新一代基模千问3.5
存储冲击、ISG重组,联想继续押注AI推理
界面新闻记者 | 周末界面新闻编辑 | 文姝琪 2月12日,联想发布25/26财年第三季度业绩报告。得益于AI相关业务的拉动作用,本季度联想营收创新高达到1575亿元人民币,同比增长18%。其中,人工 … 继续阅读 存储冲击、ISG重组,联想继续押注AI推理
红包大战正酣,算力租赁赚翻?这家厂商全线产品涨价,需求已转为“训练+推理”双轮驱动
当下,AI大模型正处于从生成式AI走向代理式AI的关键时刻。在此背景下,腾讯、阿里等厂商不惜大发红包以争夺用户。 在大模型厂商红包大战尚未分出胜负之际,算力租赁厂商却成为当下实实在在的赢家。正如服饰品 … 继续阅读 红包大战正酣,算力租赁赚翻?这家厂商全线产品涨价,需求已转为“训练+推理”双轮驱动
全球SOTA编程模型MiniMax M2.5上线
《科创板日报》12日讯,MiniMax正式上线最新旗舰编程模型MiniMax M2.5,直接对标 Claude Opus 4.6,支持PC、App、跨端应用的全栈编程开发,尤其在 Excel高阶处理、 … 继续阅读 全球SOTA编程模型MiniMax M2.5上线
面壁智能发布基于稀疏-线性混合架构SALA训练9B模型
2月12日,面壁智能正式发布稀疏-线性注意力混合架构SALA,以及基于该架构的文本模型MiniCPM-SALA,模型仅有9B参数。据介绍,MiniCPM-SALA不使用投机采样等加速算法,在云端推理芯 … 继续阅读 面壁智能发布基于稀疏-线性混合架构SALA训练9B模型
阿里达摩院开源具身大脑基模RynnBrain 机器人首次拥有时空记忆
财联社2月10日电,阿里巴巴达摩院发布具身智能大脑基础模型RynnBrain,并一次性开源了包括30B MoE在内的7个全系列模型。RynnBrain首次让机器人拥有时空记忆和空间推理能力,智能水平实 … 继续阅读 阿里达摩院开源具身大脑基模RynnBrain 机器人首次拥有时空记忆
腾讯混元AI Infra核心技术 开源:推理吞吐提升30%
腾讯混元AI Infra核心技术开源
2月4日,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库HPC-Ops。腾讯混元称,在真实场景下,基于HPC-Ops,混元模型推理QPM提升30%,DeepSeek模型QPM … 继续阅读 腾讯混元AI Infra核心技术开源

