注意力 – 第 5 页 – 冯金伟博客园

DeepSeek-V4发布前夕，先迈出“关键一步”，打通智能体提速之路

DeepSeek又有新动作了。不过，这次发布的，依然不是大家期待已久的DeepSeek-V4。但这并不妨碍它成为一次重磅亮相——DeepSeek联合清华大学与北京大学，共同推出了一套全新的推理系统 … 继续阅读 DeepSeek-V4发布前夕，先迈出“关键一步”，打通智能体提速之路

回归架构进化的本质。作者 | 陈骏达编辑 | 漠影当大模型在推理、编程等能力上不断刷新纪录时，一个新的问题也愈发突出：如何在持续提升模型能力的同时，控制算力与资源消耗？就在本月，蚂蚁集团inc … 继续阅读 3倍吞吐量、访存减至1/10！蚂蚁甩出两大万亿参数开源模型，背后架构成关键

孩子上课注意力不集中是一个普遍存在的问题，它会影响孩子的学习效果，也会影响孩子的学习兴趣。那么，孩子上课注意力不集中的原因是什么呢？首先，孩子的注意力不集中可能是由于他们的注意力不够集中。孩子们往往 … 继续阅读孩子上课注意力不集中是什么原因

很明显，xAI正处于一轮动荡之下。最扎眼的信号，莫过于接连几位联合创始人团队成员出走，包括屡次在发布会中占据“C位”的Jimmy Ba、吴宇怀等人。《商业内幕》最近的一篇报道，掀开了xAI内幕运转 … 继续阅读 xAI动荡背后：五个“作战室”同时运转，安全部门只是装饰

IT之家 2 月 24 日消息，特斯拉正起诉加利福尼亚州机动车辆管理局（DMV），要求撤销一项裁定，该裁定认定这家车企因虚假宣传车辆自动驾驶功能而违反了法律。该诉讼发生在该州行政听证办公室认定特斯拉 … 继续阅读特斯拉起诉加州车管所，要求其撤销FSD虚假宣传裁定

我们推出了 GLM-5，这是一款旨在推动编程范式从“Vibe Coding”（氛围编程）转向“Agentic Engineering”（智能体工程）的下一代基础模型。GLM-5 在前代模型 GLM-4 … 继续阅读重磅！智谱把GLM-5的所有技术细节都公开了

GLM-5是怎么炼成的？现在，它背后的论文终于完全公开了。论文的名字也很直接：告别Vibe Coding，迈入智能体工程（Agentic Engineering）。也正如我们之前实测的那般，它可 … 继续阅读智谱GLM-5技术全公开！完全适配华为等国产芯片美国网友酸了

作者｜董道力最近Cursor 发布了 Composer 1.5。这一版把强化学习规模扩大了 20 倍，后训练计算量甚至超过了基座模型的预训练投入。还加了 thinking tokens 和自我摘要 … 继续阅读 5 亿 ARR的Cursor，已经没人讨论它了？

Z Highlights Gemini 3的巨大提升是庞大团队通力协作、融合无数改进与创新的成果，其基于Transformer的混合专家架构，核心是将计算量使用与参数规模分离开来。规模是预训练中提升 … 继续阅读 Gemini 3预训练负责人揭秘Gemini 3巨大飞跃的关键，行业正从“数据无限”向“数据有限”范式转变

衡宇发自麦蒿寺量子位 | 公众号 QbitAI 2026年的除夕夜，AI技术第一次以如此密集的方式进入全民文化场景。很多观众或许说不清技术原理，但一定记住了那几个关键词：AI、机器人、具身智能 … 继续阅读春晚之后，AI和机器人为啥都去了一个地方？