刚刚,DeepSeek重要突破!大模型上下文紧箍咒打破

智东西 作者 | 陈骏达 编辑 | 云鹏 在大语言模型不断拉长上下文窗口的竞争中,DeepSeek刚刚提出了一条与众不同的技术路径。 智东西10月20日报道,今天上午,DeepSeek开源了DeepS … Continue reading 刚刚,DeepSeek重要突破!大模型上下文紧箍咒打破

提速128倍:苹果发布FS-DFM模型,AI长文写作不再等待

IT之家 10 月 14 日消息,科技媒体 9to5Mac 今天(10 月 14 日)发布博文,报道称苹果提出 FS-DFM 扩散模型,仅需 8 轮快速迭代,即可生成与传统模型上千轮迭代质量相媲美的文 … Continue reading 提速128倍:苹果发布FS-DFM模型,AI长文写作不再等待

手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速

作者 | 李水青 编辑 | 心缘 智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种 … Continue reading 手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速

谷歌“Nano Banana”图像AI模型正式开放商用:同步新增批量处理、自定义长宽比功能

IT之家 10 月 7 日消息,谷歌宣布旗下代号为 Nano Banana 的图像生成模型 Gemini 2.5 Flash Image 正式进入生产环境阶段,开始提供商业授权,官方同步更新模型新增支 … Continue reading 谷歌“Nano Banana”图像AI模型正式开放商用:同步新增批量处理、自定义长宽比功能