新智元报道 编辑:LRST 【新智元导读】SpikingBrain借鉴大脑信息处理机制,具有线性/近线性复杂度,在超长序列上具有显著速度优势,在GPU上1M长度下TTFT 速度相比主流大模型提升26. … Continue reading 全流程国产GPU,上下文提速100倍!中科院发布“线性复杂度”类脑大模型
标签: 算子
破解300倍算力增长瓶颈,华为云Tokens服务全面接入384超节点
作者 | 王涵 编辑 | 漠影 智东西8月27日报道,今天下午,在第四届828 B2B企业节开幕式上,华为云宣布其Tokens服务全面接入CloudMatrix384超节点。 借助xDeepServe … Continue reading 破解300倍算力增长瓶颈,华为云Tokens服务全面接入384超节点
火山引擎数智平台发布 Data Agent"一客一策"与AI数据湖 "算子广场"
火山引擎数智平台发布Data Agent“一客一策”与AI数据湖“算子广场”
据字节跳动数据平台消息,8月13日,在FORCE Link AI创新巡展·青岛站,火山引擎数智平台解决方案总经理萧然在现场发布了火山引擎Data Agent“一客一策”全新能力和AI数据湖服务的“AI … Continue reading 火山引擎数智平台发布Data Agent“一客一策”与AI数据湖“算子广场”
单机支持超万亿参数模型!浪潮信息发布超节点,给开源AI打造开放底座
作者 | 陈骏达 编辑 | 漠影 在刚刚过去的7月份,国产模型迎来一波重磅开源。与以往不同的是,本次国内大模型玩家们开源模型的参数量成倍增长,达到数千亿乃至万亿级别。这不仅显著提升了国产模型的能力上限 … Continue reading 单机支持超万亿参数模型!浪潮信息发布超节点,给开源AI打造开放底座
常用的梯度算子,roberts梯度算子例题
在机器学习和深度学习中,梯度是一个重要的概念。 大多数机器学习优化问题都可以用梯度下降法来处理。 介绍梯度需要知道导数(derivative )、偏导数(partial derivative )、方向 … Continue reading 常用的梯度算子,roberts梯度算子例题
移动端部署神经网络新方法:把CNN里的乘法全部去掉
前不久,机器之心报道过北大、华为诺亚等合著的一篇论文,探讨了不用乘法用加法能不能做深度学习。最近,我们又看到华为的另一篇论文,这一次没有用加法替代乘法,而是用「按位移位」和「按位取反」来取代乘法运算。 … Continue reading 移动端部署神经网络新方法:把CNN里的乘法全部去掉