财联社4月3日电,谷歌近日对Gemini API的计费档位进行更新,优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括:标准(Standard)、弹性(Flex)、优先(Priori … 继续阅读 谷歌更新Gemini API定价 按推理使用分档计费
标签: 推理
阶跃星辰上线Step 3.5 Flash新版本,新增低推理模式
4月2日,阶跃星辰宣布,最新模型Step 3.5 Flash 2603现已上线,新增low think mode,面向所有Step Plan用户开放。据介绍,测试数据显示,该模型在默认推理模式(hig … 继续阅读 阶跃星辰上线Step 3.5 Flash新版本,新增低推理模式
从“词元”到“国产算力”:科创50为何是AI推理时代的更优解?
在近期举办的GTC 2026大会上,黄仁勋的一段话引发了市场深思。他指出,AI产业的重心正在从“训练模型”向“推理应用”转移,未来每一秒钟、每一次交互,背后都是海量Token的生成与消耗。而近期中国发 … 继续阅读 从“词元”到“国产算力”:科创50为何是AI推理时代的更优解?
前阿里千问负责人林俊旸离职后首发长文:从训练模型转向训练智能体
财联社3月27日电,原阿里通义千问(Qwen)技术负责人林俊旸(Justin Lin)3月26日在社交平台上发布了一篇题为“From ‘Reasoning’ Thinking to‘Agentic’ … 继续阅读 前阿里千问负责人林俊旸离职后首发长文:从训练模型转向训练智能体
阿里巴巴:已将自研的平头哥GPU大规模投入生产
财联社3月19日电,阿里巴巴表示,公司已将自主研发的平头哥GPU大规模投入生产,支持从训练、微调到推理的端到端AI工作负载。
腾讯混元新模型计划4月对外推出
财联社3月18日电,腾讯高管3月18日在财报发布后的媒体会上透露,HY 3.0正在内部业务测试中,计划在4月对外推出。这是一次混元模型的重大升级,相比HY2.0版本效果进步明显,推理和agent能力有 … 继续阅读 腾讯混元新模型计划4月对外推出
大晓机器人开源实时生成世界模型Kairos 3.0-4B
3月13日,界面新闻获悉,大晓机器人开源开悟世界模型 3.0(Kairos 3.0)-4B系列具身原生世界模型。该模型可实现“多模态理解 — 生成 — 预测”一体化,支持在THOR端侧平台达成1:1. … 继续阅读 大晓机器人开源实时生成世界模型Kairos 3.0-4B
美的集团AI研究院院长徐翼:“推理”和“记忆”是当前智能家居系统亟待加强的两大核心能力
每经记者:陈鹏丽 每经编辑:杨军 3月10日,2026年中国家电及消费电子博览会(简称AWE2026)开幕前夕,美的集团率先在上海点燃了家电AI(人工智能)化的“第一把火”。 美的集团隆重对外发布了全 … 继续阅读 美的集团AI研究院院长徐翼:“推理”和“记忆”是当前智能家居系统亟待加强的两大核心能力
Meta:将在未来两年内推出四代新款MTIA芯片 以支持生成式人工智能的推理生产
财联社3月12日电,据META官方博客,Meta将在未来两年内推出四代新款MTIA芯片,以支持生成式人工智能的推理生产。
华为拟发布新一代AI数据基础设施新品
3月12日,界面新闻获悉,华为计划于近期发布新一代AI数据基础设施。本次发布将聚焦中心推理与智能边缘两大场景,提供可被AI Agent直接消费的数据,据称将进一步降低企业推理应用门槛。

