2026 年刚开年,DeepSeek就放出了一项重要技术进展。 1月1日,DeepSeek发表论文《Manifold-Constrained Hyper-Connections》,提出一种全新的模型连 … 继续阅读 DeepSeek梁文峰发表新论文
标签: 梯度
DeepSeek开年炸场!梁文锋又发论文了,一如既往地强
智东西 作者 | 江宇 王涵 编辑 | 心缘 智东西1月1日报道,昨日晚间,DeepSeek团队送出一份新年“贺礼”,正式发布新论文《Manifold-Constrained Hyper-Connec … 继续阅读 DeepSeek开年炸场!梁文锋又发论文了,一如既往地强
LeCun离职前的吐槽太猛了
一水 鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 好一个一吐为快! 年底就要正式离开Meta的LeCun,这下真是啥都不藏了。 不看好大语言模型能通往AGI,他就言辞犀利地指出: 通往超级智 … 继续阅读 LeCun离职前的吐槽太猛了
利用AI生成涉未成年人低俗擦边、卖惨等内容 抖音处罚超8000个账号
凤凰网科技讯 12月18日,抖音发布关于持续治理涉未成年人不良内容的公告并公布一批典型案例。公告提到,近一个月,针对涉未成年人的违规场景,平台共清理相关违规内容20.2万条,对超8000个账号处以清理 … 继续阅读 利用AI生成涉未成年人低俗擦边、卖惨等内容 抖音处罚超8000个账号
苹果iPhone手机今年全球出货量有望14年来首次超越三星
IT之家 11 月 28 日消息,根据 Counterpoint Research 今日发布的最新《智能手机市场展望追踪》,预计 2025 年全球智能手机出货量将同比增长 3.3%。 报告称,苹果的智 … 继续阅读 苹果iPhone手机今年全球出货量有望14年来首次超越三星
抖音:禁止未经平台资质认证的账号发布法律专业服务类内容
IT之家 11 月 24 日消息,抖音官方今日宣布将试行《抖音社区法律行业公约》,从账号资质规范、内容管理规范两大方面,明确平台治理规则,以及对违规行为的处置措施,以提升平台法律内容质量、规范涉法律内 … 继续阅读 抖音:禁止未经平台资质认证的账号发布法律专业服务类内容
星河动力智神星一号主发动机完成高精度、大梯度深度变推力试车
IT之家 11 月 18 日消息,星河动力航天宣布,近日,公司顺利完成智神星一号运载火箭主发动机 —— 苍穹-50(CQ-50)液氧 / 煤油发动机变推力试车。 苍穹系列发动机采用星河动力航天自研的针 … 继续阅读 星河动力智神星一号主发动机完成高精度、大梯度深度变推力试车
这些大神在Meta的论文看一篇少一篇了
离开Meta的大佬们,留下作品还在陆续发表,今天轮到田渊栋。 这次他带领团队把目光投向了大模型强化学习训练中一个令人困惑的现象:为什么RL训练明明带来巨大性能提升,却只改变了极少数参数。 论文剖析了可 … 继续阅读 这些大神在Meta的论文看一篇少一篇了
Jeff Dean盛赞姚班校友AI新研究,目前人已到Meta
一种令人兴奋的全新的范式。 谷歌AI掌舵人Jeff Dean点赞了一项新研究,还是出自清华姚班校友钟沛林团队之手。 Nested Learning嵌套学习,给出了大语言模型灾难性遗忘这一问题的最新答案 … 继续阅读 Jeff Dean盛赞姚班校友AI新研究,目前人已到Meta
小成本DeepSeek和Kimi,正攻破奥特曼的“算力护城河”
编辑:艾伦 【新智元导读】2025年前盛行的闭源+重资本范式正被DeepSeek-R1与月之暗面Kimi K2 Thinking改写,二者以数百万美元成本、开源权重,凭MoE与MuonClip等优化, … 继续阅读 小成本DeepSeek和Kimi,正攻破奥特曼的“算力护城河”

