作者 | 程茜 编辑 | 心缘 智东西10月31日消息,今天凌晨,大模型独角兽月之暗面开源混合线性注意力架构Kimi Linear,该架构首次在短上下文、长上下文、强化学习扩展机制等各种场景中超越了T … Continue reading Kimi又开源了!KV缓存暴砍75%,解码速度飙6倍
作者 | 程茜 编辑 | 心缘 智东西10月31日消息,今天凌晨,大模型独角兽月之暗面开源混合线性注意力架构Kimi Linear,该架构首次在短上下文、长上下文、强化学习扩展机制等各种场景中超越了T … Continue reading Kimi又开源了!KV缓存暴砍75%,解码速度飙6倍