算子 – 冯金伟博客园

国产GPU就是牛！摩尔线程全链路适配DeepSeek-V4

快科技5月1日消息，摩尔线程的旗舰级AI训推一体智算卡MTT S5000，搭配自研的MUSA软件栈，基于SGLang开源推理框架，成功完成了DeepSeek-V4的完整运行验证。至此，摩尔线程已构建 … 继续阅读国产GPU就是牛！摩尔线程全链路适配DeepSeek-V4

4月24日，摩尔线程宣布，其基于TileLang 0.1.8版本深度优化并已成为TileLang官方主线版本的TileLang-MUSA，已率先在国产全功能GPU上，实现对DeepSeek-V4最新T … 继续阅读摩尔线程TileLang-MUSA Day-0支持DeepSeek-V4全新TileKernels

作者 | 李水青编辑 | 漠影当AI Agent框架OpenClaw（昵称：龙虾）热潮席卷而来，起初被忽视的安全风险在同步放大。设想一个场景：你刚输入的一段公司财务数据，可能在毫无感知的情况下被 … 继续阅读云端裸奔、端侧瘸腿？这款龙虾盒子亮了：数据不出盒，能力不打折

4月3日，据沐曦股份消息，上海人工智能实验室和沐曦股份联合发布了高性能GPU算子生成系统——Kernel-Smith。据沐曦股份介绍，Kernel-Smith创新性地将“稳定评估驱动的进化智能体”与“ … 继续阅读沐曦股份：联合上海人工智能实验室发布高性能GPU算子生成系统Kernel-Smith

智东西作者｜陈骏达编辑｜云鹏 “一切都需要被重新思考，深度学习2.0时代即将来临。”在读完下方这篇来自月之暗面的最新论文后，前OpenAI大牛、“推理模型之父”Jerry Tworek发出感叹。 … 继续阅读杨植麟带队发论文，Kimi下一代模型架构曝光，推理之父惊呼：深度学习2.0要来了

端侧设备也能“养龙虾”了！作者 | 程茜编辑 | 漠影用1TOPS算力芯片“养龙虾”是什么体验？智东西3月12日报道，今日，在AWE中国家电及消费电子博览会上，上海海思亮出基于CV610的Ze … 继续阅读端侧AI进入生态与场景决胜时代，上海海思给出端侧AI最优解

回归架构进化的本质。作者 | 陈骏达编辑 | 漠影当大模型在推理、编程等能力上不断刷新纪录时，一个新的问题也愈发突出：如何在持续提升模型能力的同时，控制算力与资源消耗？就在本月，蚂蚁集团inc … 继续阅读 3倍吞吐量、访存减至1/10！蚂蚁甩出两大万亿参数开源模型，背后架构成关键

闻乐发自凹非寺量子位 | 公众号 QbitAI 情人节到了… 那咱也来应应景，讲讲亲吻这件事—— AI的打开方式。你或许知道，数学上有个正经问题叫做亲吻数（Kissing Number Pro … 继续阅读情人节最硬核“Kiss”！中国AI突破300年亲吻数难题，连刷多维度纪录

作者 | 陈骏达编辑 | 李水青破案了，前两天在开发者社区爆火的“Pony Alpha”，就是智谱的GLM-5！智东西2月12日报道，今天，智谱发布了其最新一代基础模型GLM-5，这是一个拥有7 … 继续阅读智谱最强模型发布！编程对齐Claude Opus 4.5，七家国产芯片已火速适配

IT之家 2 月 12 日消息，2 月 11 日，智谱正式发布新一代大模型 GLM-5。摩尔线程基于 SGLang 推理框架，在旗舰级 AI 训推一体全功能 GPU MTT S5000 上，Day-0 … 继续阅读摩尔线程实现智谱GLM-5大模型Day-0适配，国产GPU生态兼容再进一步