推理 – 冯金伟博客园

云天励飞：最新一代DeepVerse系列芯片主要面向大模型的云端推理

每经AI快讯，云天励飞日前接受机构调研时称，公司最新一代的DeepVerse系列芯片主要面向大模型的云端推理，将采用国产制程。未来三年，云天励飞规划了三代芯片产品。

《科创板日报》5月9日讯（编辑宋子乔）当地时间周四，边缘云公司阿卡迈（Akamai）宣布与一家“领先的前沿模型提供商”达成一项为期七年、价值18亿美元的云计算协议，据外媒最新报道，知情人士透露，这 … 继续阅读 CDN服务商挤上AI牌桌：这家公司与Anthropic签七年长约边缘推理成合作重点

2025年以来，全球范围内与AI相关的数据安全事件密集发生。某头部AI公司的训练数据泄露、某企业员工通过AI助手无意间上传了内部代码、某医疗机构的患者数据在模型调用过程中被第三方截获——这些事件一再提 … 继续阅读 Trustworthy AI的物理学解法：明略科技(2718.HK)为什么选择让模型离线

财联社5月6日电，美东时间周二盘后，AMD管理层在财报电话会上表示，AMD预计未来几年服务器中央处理器（CPU）总潜在市场年复合增长率超35%，并将2030年市场规模预期从去年预测的600亿美元翻倍上 … 继续阅读 AMD：将2030年服务器市场规模预期从600亿美元上调至1200亿美元推理与智能体AI应用正加速提升服务器CPU算力需求

4 月 23 日，腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型，总参数295B，激活参数 21B，最大支持 256K 上下文长度。这是混元重建后训练的第一个 … 继续阅读姚顺雨入职腾讯后首作Hy3 preview模型发布，“混元大模型重建第一步”

每经AI快讯，4月23日，腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型，总参数 295B，激活参数 21B，最大支持 256K 上下文长度。这是混元重建后训 … 继续阅读腾讯混元Hy3 preview发布并开源：混元重建后首个模型

4 月 23 日，腾讯混元 Hy3 preview 语言模型发布并开源。据介绍，Hy3 preview 是一个快慢思考融合的混合专家模型，总参数 295B，激活参数 21B，最大支持 256K 上下文 … 继续阅读腾讯发布混元Hy3 preview并开源，系混元重建后首个模型

截至2026年4月22日 10:09，中证5G产业50指数(931406)强势上涨1.73%，成分股亨通光电上涨8.86%，协创数据上涨6.99%，紫光股份上涨6.41%，鹏鼎控股，烽火通信等个股跟涨 … 继续阅读全国首个Pre6G试验网在南京投入运行，5GETF博时(159811)涨超1%

财联社4月3日电，谷歌近日对Gemini API的计费档位进行更新，优化方案与定价均基于实际推理使用需求制定。本次新增的推理服务档位包括：标准(Standard)、弹性(Flex)、优先(Priori … 继续阅读谷歌更新Gemini API定价按推理使用分档计费

4月2日，阶跃星辰宣布，最新模型Step 3.5 Flash 2603现已上线，新增low think mode，面向所有Step Plan用户开放。据介绍，测试数据显示，该模型在默认推理模式（hig … 继续阅读阶跃星辰上线Step 3.5 Flash新版本，新增低推理模式