智东西11月5日消息,刚刚,华为正式开源了UCM(Unified Cache Manager)推理记忆数据管理,这是一项针对AI推理加速的关键技术。 ▲GitCode项目页面 今年8月12日,华为正式 … Continue reading 刚刚,华为AI推理大招开源,时延降90%,吞吐提22倍,上下文10倍级扩展
标签: kv
刚刚,华为AI推理大招开源,时延降90%,吞吐提22倍,上下文10倍级扩展
智东西 作者 | 云鹏 编辑 | 李水青 智东西11月5日消息,刚刚,华为正式开源了UCM(Unified Cache Manager)推理记忆数据管理,这是一项针对AI推理加速的关键技术。 GitC … Continue reading 刚刚,华为AI推理大招开源,时延降90%,吞吐提22倍,上下文10倍级扩展
英伟达发布BlueField-4 DPU:集成64核Arm CPU,支持800G网络
IT之家 10 月 29 日消息,在今日举行的 NVIDIA GTC 2025 年 10 月大会(GTC DC)上,英伟达发布了多项重磅新品,其中一项尤为引人注目:下一代 NVIDIA BlueFie … Continue reading 英伟达发布BlueField-4 DPU:集成64核Arm CPU,支持800G网络

