DeepSeek又有新动作了。 不过,这次发布的,依然不是大家期待已久的DeepSeek-V4。 但这并不妨碍它成为一次重磅亮相——DeepSeek联合清华大学与北京大学,共同推出了一套全新的推理系统 … 继续阅读 DeepSeek-V4发布前夕,先迈出“关键一步”,打通智能体提速之路
标签: 注意力
3倍吞吐量、访存减至1/10!蚂蚁甩出两大万亿参数开源模型,背后架构成关键
回归架构进化的本质。 作者 | 陈骏达 编辑 | 漠影 当大模型在推理、编程等能力上不断刷新纪录时,一个新的问题也愈发突出:如何在持续提升模型能力的同时,控制算力与资源消耗? 就在本月,蚂蚁集团inc … 继续阅读 3倍吞吐量、访存减至1/10!蚂蚁甩出两大万亿参数开源模型,背后架构成关键
孩子上课注意力不集中是什么原因
孩子上课注意力不集中是一个普遍存在的问题,它会影响孩子的学习效果,也会影响孩子的学习兴趣。那么,孩子上课注意力不集中的原因是什么呢? 首先,孩子的注意力不集中可能是由于他们的注意力不够集中。孩子们往往 … 继续阅读 孩子上课注意力不集中是什么原因
xAI动荡背后:五个“作战室”同时运转,安全部门只是装饰
很明显,xAI正处于一轮动荡之下。 最扎眼的信号,莫过于接连几位联合创始人团队成员出走,包括屡次在发布会中占据“C位”的Jimmy Ba、吴宇怀等人。 《商业内幕》最近的一篇报道,掀开了xAI内幕运转 … 继续阅读 xAI动荡背后:五个“作战室”同时运转,安全部门只是装饰
特斯拉起诉加州车管所,要求其撤销FSD虚假宣传裁定
IT之家 2 月 24 日消息,特斯拉正起诉加利福尼亚州机动车辆管理局(DMV),要求撤销一项裁定,该裁定认定这家车企因虚假宣传车辆自动驾驶功能而违反了法律。 该诉讼发生在该州行政听证办公室认定特斯拉 … 继续阅读 特斯拉起诉加州车管所,要求其撤销FSD虚假宣传裁定
重磅!智谱把GLM-5的所有技术细节都公开了
我们推出了 GLM-5,这是一款旨在推动编程范式从“Vibe Coding”(氛围编程)转向“Agentic Engineering”(智能体工程)的下一代基础模型。GLM-5 在前代模型 GLM-4 … 继续阅读 重磅!智谱把GLM-5的所有技术细节都公开了
智谱GLM-5技术全公开!完全适配华为等国产芯片 美国网友酸了
GLM-5是怎么炼成的? 现在,它背后的论文终于完全公开了。 论文的名字也很直接:告别Vibe Coding,迈入智能体工程(Agentic Engineering)。 也正如我们之前实测的那般,它可 … 继续阅读 智谱GLM-5技术全公开!完全适配华为等国产芯片 美国网友酸了
5 亿 ARR的Cursor,已经没人讨论它了?
作者|董道力 最近Cursor 发布了 Composer 1.5。 这一版把强化学习规模扩大了 20 倍,后训练计算量甚至超过了基座模型的预训练投入。还加了 thinking tokens 和自我摘要 … 继续阅读 5 亿 ARR的Cursor,已经没人讨论它了?
Gemini 3预训练负责人揭秘Gemini 3巨大飞跃的关键,行业正从“数据无限”向“数据有限”范式转变
Z Highlights Gemini 3的巨大提升是庞大团队通力协作、融合无数改进与创新的成果,其基于Transformer的混合专家架构,核心是将计算量使用与参数规模分离开来。 规模是预训练中提升 … 继续阅读 Gemini 3预训练负责人揭秘Gemini 3巨大飞跃的关键,行业正从“数据无限”向“数据有限”范式转变
春晚之后,AI和机器人为啥都去了一个地方?
衡宇 发自 麦蒿寺 量子位 | 公众号 QbitAI 2026年的除夕夜,AI技术第一次以如此密集的方式进入全民文化场景。 很多观众或许说不清技术原理,但一定记住了那几个关键词:AI、机器人、具身智能 … 继续阅读 春晚之后,AI和机器人为啥都去了一个地方?

