作者 | 程茜 编辑 | 心缘 智东西10月31日消息,今天凌晨,大模型独角兽月之暗面开源混合线性注意力架构Kimi Linear,该架构首次在短上下文、长上下文、强化学习扩展机制等各种场景中超越了T … Continue reading Kimi又开源了!KV缓存暴砍75%,解码速度飙6倍
标签: 上下文
AI爆点转移至多模态,体现了什么行业趋势?
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2025年的AI爆点正在发生转移。 自DeepSeek R1上半年引爆行业情绪之后,“纯文本+推理”范式下的模型鲜少再现重量级成果。进入下半年,话题重 … Continue reading AI爆点转移至多模态,体现了什么行业趋势?
华大集团:全球首个百亿级人类基因组基础模型Genos发布
据华大集团消息,10月23日,在第二十届国际基因组学大会(ICG-20)上,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。据介绍,这一针对人类基因组深度 … Continue reading 华大集团:全球首个百亿级人类基因组基础模型Genos发布
全球首个百亿级可部署基因组基础模型诞生
财联社10月23日电,华大生命科学研究院与之江实验室23日联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
DeepSeek-OCR:大模型技术,正站在一个新的十字路口
想象一下,在这个AI技术如潮水般涌来的时代,我们忽然发现,一张简单的图像,竟然能以惊人的效率承载海量文字信息。这已不是“想象”,而是刚刚发生的现实。 本周,DeepSeek开源了一个名为“DeepSe … Continue reading DeepSeek-OCR:大模型技术,正站在一个新的十字路口
刚刚,DeepSeek重要突破!大模型上下文紧箍咒打破
智东西 作者 | 陈骏达 编辑 | 云鹏 在大语言模型不断拉长上下文窗口的竞争中,DeepSeek刚刚提出了一条与众不同的技术路径。 智东西10月20日报道,今天上午,DeepSeek开源了DeepS … Continue reading 刚刚,DeepSeek重要突破!大模型上下文紧箍咒打破
DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
快科技10月21日消息,据媒体报道,DeepSeek在GitHub上开源了其最新研究成果——DeepSeek-OCR模型。 据介绍,DeepSeek-OCR的参数量约为3B,是研究团队对“光学二维映射 … Continue reading DeepSeek开源3B OCR模型:97%精度刷新长文本压缩极限
DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本压缩
财联社10月20日电,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Huggin … Continue reading DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本压缩
OPPO官宣AI战略三大底座!AIOS登场,小布记忆拿下吉尼斯,协同支付宝智能体
智东西 作者 | 江宇 编辑 | 李水青 智东西10月15日报道,在今日举行的2025 OPPO AI峰会上,OPPO首次系统性提出AI操作系统(AIOS)的三大核心技术支撑方向——新计算、新感知与新 … Continue reading OPPO官宣AI战略三大底座!AIOS登场,小布记忆拿下吉尼斯,协同支付宝智能体
手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速
作者 | 李水青 编辑 | 心缘 智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种 … Continue reading 手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速

