“在AI超节点系统的设计上,不应该再依照惯性思维,过分追求规模,而是应该从客户视角出发,把token交互速度作为关键衡量指标,这是智能体时代AI超节点的核心商业价值。”这是浪潮信息首席AI战略官刘军近 … 继续阅读 浪潮信息刘军:速度就是金钱,AI超节点的核心是Token交互速度
标签: token
每秒110万个token!微软联手英伟达刷新AI推理纪录
IT之家 11 月 5 日消息,微软当地时间 11 月 4 日宣布,其 Azure ND GB300 v6 虚拟机在运行 Meta 的 Llama2 70B 模型时,推理速度达到了每秒 110 万个 … 继续阅读 每秒110万个token!微软联手英伟达刷新AI推理纪录
刚刚,阿里祭出Qwen3超大杯思考模型,数学考试满分,实测竟成token“吞金兽”
作者 | 陈骏达 编辑 | 李水青 阿里的“超大杯”思考模型,终于现身了! 智东西11月4日报道,刚刚,阿里发布了Qwen 3系列中最强推理模型Qwen3-Max-Thinking的早期预览版。尽管这 … 继续阅读 刚刚,阿里祭出Qwen3超大杯思考模型,数学考试满分,实测竟成token“吞金兽”
AI基建的价值将会向哪里集中?
近来市场上开始流行一种说法:随着 GPU 成本下降、模型标准化、算力即服务(AIaaS)成为基础设施,价值会逐渐从芯片公司(如英伟达)转移到云服务商,就像铁路时代后期价值从钢铁制造商转向铁路运营商一样 … 继续阅读 AI基建的价值将会向哪里集中?
必须配核电站了!NVIDIA打造20亿瓦功耗的AI数据中心
快科技10月29日消息,GTC 2025大会上,NVIDIA发布了“Omniverse DSX Blueprint”,一套面向吉瓦(10亿瓦)级AI数据中心的参考设计,NVIDIA也叫它“AI工厂”。 … 继续阅读 必须配核电站了!NVIDIA打造20亿瓦功耗的AI数据中心
苹果:Apple Pay过去一年协助用户规避超10亿美元欺诈行为
IT之家 10 月 27 日消息,负责 Apple Pay 和钱包业务的苹果副总裁 Jennifer Bailey 昨天出席 Money 20/20 USA 大会,发表主题演讲,与听众分享苹果钱包业务 … 继续阅读 苹果:Apple Pay过去一年协助用户规避超10亿美元欺诈行为
DeepSeek昨天开源的新模型,有点邪门
DeepSeek 又整出新东西来了,只用到原本十分之一 token,就能存下几乎一样的文字信息,这压缩比,香农看了都要流泪,冯·诺伊曼看了都要沉默。 更是直接把一堆老外给钓成了翘嘴。 昨 … 继续阅读 DeepSeek昨天开源的新模型,有点邪门
刚刚,DeepSeek重要突破!大模型上下文紧箍咒打破
智东西 作者 | 陈骏达 编辑 | 云鹏 在大语言模型不断拉长上下文窗口的竞争中,DeepSeek刚刚提出了一条与众不同的技术路径。 智东西10月20日报道,今天上午,DeepSeek开源了DeepS … 继续阅读 刚刚,DeepSeek重要突破!大模型上下文紧箍咒打破
DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
快科技10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。 据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射 … 继续阅读 DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
提速128倍:苹果发布FS-DFM模型,AI长文写作不再等待
IT之家 10 月 14 日消息,科技媒体 9to5Mac 今天(10 月 14 日)发布博文,报道称苹果提出 FS-DFM 扩散模型,仅需 8 轮快速迭代,即可生成与传统模型上千轮迭代质量相媲美的文 … 继续阅读 提速128倍:苹果发布FS-DFM模型,AI长文写作不再等待

