长度 – 第 4 页 – 冯金伟博客园

DeepSeek-V4发布前夕，先迈出“关键一步”，打通智能体提速之路

DeepSeek又有新动作了。不过，这次发布的，依然不是大家期待已久的DeepSeek-V4。但这并不妨碍它成为一次重磅亮相——DeepSeek联合清华大学与北京大学，共同推出了一套全新的推理系统 … 继续阅读 DeepSeek-V4发布前夕，先迈出“关键一步”，打通智能体提速之路

IT之家 2 月 28 日消息，MIT News 于 2 月 26 日发布博文，报道称麻省理工学院（MIT）联合英伟达等机构，发布“驯服长尾”（TLT）技术，可以大幅提升推理大语言模型（LLM）的训练 … 继续阅读 MIT携手英伟达开发TLT技术，推理大模型训练效率最高提速210%

过去这两年，大语言模型走得实在太快，尤其在那些需要复杂逻辑推理的任务上，能力已经高到了一个我们以前不太敢想的水平。我到现在还记得 ChatGPT-3.5 那个时代。那时候的 AI 顶多帮你做点简单数 … 继续阅读字节跳动新算法，直接把1/3的算力砍掉了

DeepSeek这小子最精了，当全世界都在盯着他的GitHub仓库，等待V4时—— DeepSeek和北大、清华在ArXiv悄咪咪地上了一篇论文，发布了一个全新的针对智能体的推理框架：DualPath … 继续阅读网卡别闲着啊！DeepSeek用它加速智能体推理效果杠杠的

IT之家 2 月 26 日消息，消息源 @legit_api 今天（2 月 26 日）在 X 平台发布推文，报道称 DeepSeek 正在测试 V4 Lite 模型，代号为“Sealion-lite” … 继续阅读 DeepSeek V4 Lite原生多模态AI曝光：百万tokens上下文，非思考生图秒杀前代

IT之家 2 月 25 日消息，阿里在除夕夜炸场，发布了“开源旗舰”Qwen3.5 模型，登顶全球最强开源模型。今日，阿里宣布 Qwen3.5 开源家族扩容，继旗舰模型 Qwen3.5-397B-A … 继续阅读阿里Qwen3.5开源家族扩容，多尺寸AI模型上新

我们推出了 GLM-5，这是一款旨在推动编程范式从“Vibe Coding”（氛围编程）转向“Agentic Engineering”（智能体工程）的下一代基础模型。GLM-5 在前代模型 GLM-4 … 继续阅读重磅！智谱把GLM-5的所有技术细节都公开了

IT之家 2 月 18 日消息，Android XR 将在今年正式启动，谷歌与三星正筹备推出各自搭载透明显示镜片的 AI 眼镜。据外媒 Android Authority 今日报道，谷歌已开始在产品发 … 继续阅读谷歌详解“安卓眼镜”应用设计：告别鲜艳色调，界面悬浮于一米外

新智元报道编辑：Aeneas kingHZ 【新智元导读】DeepSeek V4，据说明天就要上线了？这是首个匹敌顶尖闭源模型的开源模型，被网友评为「一鲸落万物生」。泄露的基准测试显示，它在SWE- … 继续阅读刚刚，DeepSeek V4基准测试泄露！疑似明天发布，全场惊呼新王归来

AI到底能不能赚钱？给AI烧钱是不是太多了？稍微看点AI圈新闻的差友们心里，肯定有上面这两个嘀咕。但就在前两天，谷歌的母公司Alphabet（为了方便后续阅读，仅以谷歌替代）发布了最新的四季度财报 … 继续阅读日均烧掉5个亿！谷歌这份败家财报把华尔街都给整不会了