从魔改PTX到使用 UE8M0 FP8 Scale 的参数精度,DeepSeek先榨取英伟达GPU算力,再适配国产芯片,可能会在软硬件协同方面带来新的突破,进一步提高训练效率,最多可以减少 75% 的 … Continue reading DeepSeek V3到V3.1,如何走向算力自由
标签: 框架
GPT-5变蠢背后:抑制AI的幻觉,反而让模型没用了?
自打发布新一代模型 GPT-5 之后,OpenAI 收获了大片骂声。 人们纷纷表示 GPT-5 “ 变蠢了 ”“ 没创造力了 ”“ 不灵动了 ”“ 回答很干瘪 ”。 实际上,这并不是一个让人意外的结果 … Continue reading GPT-5变蠢背后:抑制AI的幻觉,反而让模型没用了?
路特斯科技(莲花跑车)获最高 5 亿美元资金承诺
IT之家 8 月 22 日消息,据莲花跑车公众号消息,路特斯科技有限公司宣布已与总部位于纽约、专注于长期增长潜力前沿企业的投资机构 ATW Partners 签署证券购买协议。 根据协议,公司将向 A … Continue reading 路特斯科技(莲花跑车)获最高 5 亿美元资金承诺
波士顿动力机器人终于有脑子了!人类故意使绊子也不怕
波士顿动力也搞端到端AI了! 这次升级,Atlas不仅可以听懂自然语言指令,还可以自主规划动作和处理意外。 只见小哥故意合上盖子,机器人仍能识别并打开箱子。 故意挪动箱子位置,它也能精确识别到变化。 … Continue reading 波士顿动力机器人终于有脑子了!人类故意使绊子也不怕
DeepSeek昨天悄悄扔的炸弹,今天爆了
摘要:其实利好谁并不需要猜测,因为DeepSeek此次就是要普遍支持国产芯片生态。 凤凰网科技 出品 作者|姜凡 编辑|董雨晴 DeepSeek在8月21日正式发布V3.1,一则官方补充留言激起千层浪 … Continue reading DeepSeek昨天悄悄扔的炸弹,今天爆了
谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
时令 发自 凹非寺 大模型耗电惊人,舆论一浪高过一浪。 现在,谷歌用硬核数据强势还击。 一次Gemini查询仅能耗0.24wh,相当于微波炉运行1秒,排放0.03 g CO₂e,甚至比人放一次屁还少, … Continue reading 谷歌技术报告披露大模型能耗:响应一次相当于微波炉叮一秒
请立即更新:苹果紧急修复iPhone/iPad高危漏洞,已被黑客利用发起攻击
IT之家 8 月 21 日消息,科技媒体 bleepingcomputer 昨日(8 月 20 日)发布博文,报道称苹果公司发布紧急更新,修复编号为 CVE-2025-43300 的零日漏洞。该漏洞存 … Continue reading 请立即更新:苹果紧急修复iPhone/iPad高危漏洞,已被黑客利用发起攻击
余承东40分钟央视专访:“遥遥领先”讲得非常少,谈鸿蒙生死线,回应套壳质疑
作者 | 陈骏达 编辑 | 心缘 智东西8月18日报道,昨日央视《对话》最新一期栏目上线,对华为常务董事、终端BG董事长余承东进行了长达40分钟的深度访谈。正值鸿蒙5.0(纯血鸿蒙)设备数突破1000 … Continue reading 余承东40分钟央视专访:“遥遥领先”讲得非常少,谈鸿蒙生死线,回应套壳质疑
全球首款“微波大脑”问世:未来手机芯片AI通信一体化,既当大脑又当天线
IT之家 8 月 16 日消息,科技媒体 Tom’s Hardware 昨日(8 月 15 日)发布博文,报道称康奈尔大学研究团队开发出全球首款“微波大脑”(microwave brain … Continue reading 全球首款“微波大脑”问世:未来手机芯片AI通信一体化,既当大脑又当天线
戴尔推出掌上AI超算!字典大小,1000TOPS峰值算力,能跑2000亿参数模型
作者 | ZeR0 编辑 | 漠影 智东西8月15日报道,今日,在戴尔科技峰会(DTF)期间,戴尔科技正式发布专为AI推理设计的“掌上AI超算”Dell Pro Max with GB10。 这是De … Continue reading 戴尔推出掌上AI超算!字典大小,1000TOPS峰值算力,能跑2000亿参数模型