DeepSeek又有新动作了。 不过,这次发布的,依然不是大家期待已久的DeepSeek-V4。 但这并不妨碍它成为一次重磅亮相——DeepSeek联合清华大学与北京大学,共同推出了一套全新的推理系统 … 继续阅读 DeepSeek-V4发布前夕,先迈出“关键一步”,打通智能体提速之路
标签: 长度
MIT携手英伟达开发TLT技术,推理大模型训练效率最高提速210%
IT之家 2 月 28 日消息,MIT News 于 2 月 26 日发布博文,报道称麻省理工学院(MIT)联合英伟达等机构,发布“驯服长尾”(TLT)技术,可以大幅提升推理大语言模型(LLM)的训练 … 继续阅读 MIT携手英伟达开发TLT技术,推理大模型训练效率最高提速210%
字节跳动新算法,直接把1/3的算力砍掉了
过去这两年,大语言模型走得实在太快,尤其在那些需要复杂逻辑推理的任务上,能力已经高到了一个我们以前不太敢想的水平。 我到现在还记得 ChatGPT-3.5 那个时代。那时候的 AI 顶多帮你做点简单数 … 继续阅读 字节跳动新算法,直接把1/3的算力砍掉了
网卡别闲着啊!DeepSeek用它加速智能体推理 效果杠杠的
DeepSeek这小子最精了,当全世界都在盯着他的GitHub仓库,等待V4时—— DeepSeek和北大、清华在ArXiv悄咪咪地上了一篇论文,发布了一个全新的针对智能体的推理框架:DualPath … 继续阅读 网卡别闲着啊!DeepSeek用它加速智能体推理 效果杠杠的
DeepSeek V4 Lite原生多模态AI曝光:百万tokens上下文,非思考生图秒杀前代
IT之家 2 月 26 日消息,消息源 @legit_api 今天(2 月 26 日)在 X 平台发布推文,报道称 DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite” … 继续阅读 DeepSeek V4 Lite原生多模态AI曝光:百万tokens上下文,非思考生图秒杀前代
阿里Qwen3.5开源家族扩容,多尺寸AI模型上新
IT之家 2 月 25 日消息,阿里在除夕夜炸场,发布了“开源旗舰”Qwen3.5 模型,登顶全球最强开源模型。 今日,阿里宣布 Qwen3.5 开源家族扩容,继旗舰模型 Qwen3.5-397B-A … 继续阅读 阿里Qwen3.5开源家族扩容,多尺寸AI模型上新
重磅!智谱把GLM-5的所有技术细节都公开了
我们推出了 GLM-5,这是一款旨在推动编程范式从“Vibe Coding”(氛围编程)转向“Agentic Engineering”(智能体工程)的下一代基础模型。GLM-5 在前代模型 GLM-4 … 继续阅读 重磅!智谱把GLM-5的所有技术细节都公开了
谷歌详解“安卓眼镜”应用设计:告别鲜艳色调,界面悬浮于一米外
IT之家 2 月 18 日消息,Android XR 将在今年正式启动,谷歌与三星正筹备推出各自搭载透明显示镜片的 AI 眼镜。据外媒 Android Authority 今日报道,谷歌已开始在产品发 … 继续阅读 谷歌详解“安卓眼镜”应用设计:告别鲜艳色调,界面悬浮于一米外
刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来
新智元报道 编辑:Aeneas kingHZ 【新智元导读】DeepSeek V4,据说明天就要上线了?这是首个匹敌顶尖闭源模型的开源模型,被网友评为「一鲸落万物生」。泄露的基准测试显示,它在SWE- … 继续阅读 刚刚,DeepSeek V4基准测试泄露!疑似明天发布,全场惊呼新王归来
日均烧掉5个亿!谷歌这份败家财报 把华尔街都给整不会了
AI到底能不能赚钱?给AI烧钱是不是太多了? 稍微看点AI圈新闻的差友们心里,肯定有上面这两个嘀咕。 但就在前两天,谷歌的母公司Alphabet(为了方便后续阅读,仅以谷歌替代)发布了最新的四季度财报 … 继续阅读 日均烧掉5个亿!谷歌这份败家财报 把华尔街都给整不会了

