MIT携手英伟达开发TLT技术,推理大模型训练效率最高提速210%

IT之家 2 月 28 日消息,MIT News 于 2 月 26 日发布博文,报道称麻省理工学院(MIT)联合英伟达等机构,发布“驯服长尾”(TLT)技术,可以大幅提升推理大语言模型(LLM)的训练 … 继续阅读 MIT携手英伟达开发TLT技术,推理大模型训练效率最高提速210%

庞若鸣舍弃两亿美元投奔OpenAI,Meta究竟烂到什么地步了?

当初抢人有多高调,现在人跑了就有多尴尬。 去年Meta的一波高薪抢人大战,相信大家还有印象。彼时“庞若鸣”是一个很有代表性的人物,因为: 第一,他很重要,是苹果基础模型团队的负责人。 第二,Meta给 … 继续阅读 庞若鸣舍弃两亿美元投奔OpenAI,Meta究竟烂到什么地步了?

Nano Banana 2发布,图像生成下半场比的是“世界知识”

进入2026年以后,很少有人再提起图像生成模型,行业内的焦点全在agent身上。 图像生成模型,似乎已经成为“上一个时代”的故事。大多数从业者的共识是,图像生成的技术路线已经基本定型,剩下的只是工程优 … 继续阅读 Nano Banana 2发布,图像生成下半场比的是“世界知识”

网卡别闲着啊!DeepSeek用它加速智能体推理 效果杠杠的

DeepSeek这小子最精了,当全世界都在盯着他的GitHub仓库,等待V4时—— DeepSeek和北大、清华在ArXiv悄咪咪地上了一篇论文,发布了一个全新的针对智能体的推理框架:DualPath … 继续阅读 网卡别闲着啊!DeepSeek用它加速智能体推理 效果杠杠的

谷歌生图新王Nano Banana 2深夜突袭!性能屠榜速度飞升,价格腰斩【附实测】

作者 | 李水青 编辑 | 云鹏 智东西2月27日报道,刚刚,谷歌正式发布其最强图片生成和编辑模型Nano Banana 2(Gemini 3.1 Flash Image),该模型已在谷歌Gemini … 继续阅读 谷歌生图新王Nano Banana 2深夜突袭!性能屠榜速度飞升,价格腰斩【附实测】

DeepSeek V4 Lite原生多模态AI曝光:百万tokens上下文,非思考生图秒杀前代

IT之家 2 月 26 日消息,消息源 @legit_api 今天(2 月 26 日)在 X 平台发布推文,报道称 DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite” … 继续阅读 DeepSeek V4 Lite原生多模态AI曝光:百万tokens上下文,非思考生图秒杀前代

MiniMax和智谱的那道坎,中国AI公司都逃不掉

撰文|画画 今天中国AI公司的命,某种程度是被资本市场捏在手里的。 2月23日这天,这句话应验了。 智谱,43天涨5倍,1天跌22%,735亿港元蒸发。 MiniMax,42天涨近5倍,1天跌13%, … 继续阅读 MiniMax和智谱的那道坎,中国AI公司都逃不掉

智谱GLM-5技术全公开!完全适配华为等国产芯片 美国网友酸了

GLM-5是怎么炼成的? 现在,它背后的论文终于完全公开了。 论文的名字也很直接:告别Vibe Coding,迈入智能体工程(Agentic Engineering)。 也正如我们之前实测的那般,它可 … 继续阅读 智谱GLM-5技术全公开!完全适配华为等国产芯片 美国网友酸了

总理座谈会上的年轻人,春节暴涨超千亿

去年底因为参加总理座谈会而备受瞩目的闫俊杰,真正是度过了一个马上暴富的春节: 腊月25至正月初五,他创立的上海稀宇极智科技有限公司(MiniMax),股价从500多元飙升至近千元,市值也拉升到超过30 … 继续阅读 总理座谈会上的年轻人,春节暴涨超千亿