IT之家 10 月 4 日消息,阿里云通义千问今日宣布开源 Qwen3-VL-30B-A3B-Instruct 与 Thinking 模型,并同步推出 FP8 版本以及超大规模模型 Qwen3-VL- … Continue reading 通义开源Qwen3-VL-30B-A3B模型:智能体任务等领域媲美GPT-5-Mini
标签: 上下文
DeepSeek-V3.2-Exp模型正式发布并开源
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模 … Continue reading DeepSeek-V3.2-Exp模型正式发布并开源
DeepSeek V3.2、GLM4.6等大模型即将发布
财联社9月29日电,DeepSeek-V3.2即将发布,据了解,v3.2-base已上传至DeepSeek的HuggingFace官方页面,模型文件正在上传中,不过目前已下线。同时,智谱GLM4.6也 … Continue reading DeepSeek V3.2、GLM4.6等大模型即将发布
蚂蚁百灵开卷模型性价比!长文本推理只要1/10成本,6.1B激活撬动40B性能
作者 | 江宇 编辑 | 漠影 智东西9月26日报道,蚂蚁百灵团队近日正式开源两款全新混合线性推理模型——Ring-mini-linear-2.0与Ring-flash-linear-2.0。相比前代 … Continue reading 蚂蚁百灵开卷模型性价比!长文本推理只要1/10成本,6.1B激活撬动40B性能
字节跳动推出豆包翻译大模型:支持28种语言互译,性能比肩GPT-4o
IT之家 9 月 22 日消息,字节跳动旗下火山引擎近日发布了其全新的通用翻译大模型 ——Doubao-Seed-Translation(豆包翻译模型),该模型支持 28 种语言互译,覆盖中、英、日、 … Continue reading 字节跳动推出豆包翻译大模型:支持28种语言互译,性能比肩GPT-4o
刚刚,小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很
智东西 作者 | 程茜 编辑 | 李水青 智东西9月19日消息,刚刚,小米正式开源首个原生端到端语音模型Xiaomi-MiMo-Audio,该模型参数规模70亿,预训练数据达到超1亿小时,且在开源模型 … Continue reading 刚刚,小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很
马斯克:Grok Code下周将发布重大升级和修复
马斯克9月18日发文称,Grok Code将在下周发布许多重大升级和修复,包括1M上下文窗口。
硅基流动上线蚂蚁集团Ling-flash-2.0模型
9月18日,硅基流动大模型服务平台首发上线蚂蚁集团百灵团队最新开源的Ling-flash-2.0。硅基流动平台上线的Ling-flash-2.0支持128K最大上下文长度,价格为输入1元/M Toke … Continue reading 硅基流动上线蚂蚁集团Ling-flash-2.0模型
拿下超4亿融资,一年营收增长10倍!英伟达投了这家AI代码审查创企
智东西 编译 | 许丙南 编辑 | 程茜 智东西9月17日消息,AI代码审查初创公司CodeRabbit获6000万美元(约合人民币4.32亿元)B轮融资,公司估值达到5.5亿美元(约合人民币39.6 … Continue reading 拿下超4亿融资,一年营收增长10倍!英伟达投了这家AI代码审查创企
阿里Qoder开卖!每月140元,性价比是Cursor的1.48倍
作者 | 王涵 编辑 | 漠影 智东西9月16日消息,昨晚,“阿里版Cursor”AI编程平台Qoder面向全球用户正式推出付费订阅,Pro用户订阅费用为每月20美金(约合人民币142.4元),Pro … Continue reading 阿里Qoder开卖!每月140元,性价比是Cursor的1.48倍

