AI编程节省95%token,工具调用上限狂飙20倍,开源记忆系统登顶GitHub热榜

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 用Claude Code写代码的人,终于不用每次开新会话都从头解释项目背景了。 顶GitHub开源热榜的一款持久化记忆系统Claude-Mem,直 … 继续阅读 AI编程节省95%token,工具调用上限狂飙20倍,开源记忆系统登顶GitHub热榜

华为发布AI新技术:单卡同时承载多AI工作负载 提升硬件资源利用率

快科技11月21日消息,据媒体报道,华为今日正式发布Flex:ai AI容器软件。该产品的核心突破在于运用算力切分技术,可将单张GPU/NPU算力卡精细切分为多个虚拟算力单元,最小粒度精准至10%。 … 继续阅读 华为发布AI新技术:单卡同时承载多AI工作负载 提升硬件资源利用率

向替代英伟达护城河CUDA发起冲击!寒武纪亮出软件全家桶

中国AI芯片公司寒武纪完成了其基础软件平台Cambricon NeuWare在大模型训练推理和搜广推系统等核心场景的大规模技术验证,标志着该公司从硬件供应商向提供完整AI解决方案的平台企业转型取得关键 … 继续阅读 向替代英伟达护城河CUDA发起冲击!寒武纪亮出软件全家桶