阿里通义千问发布小尺寸模型Qwen3-4B新版本

8月7日,阿里通义千问发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。据通义千问介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越了闭源的GPT4.1-Nano;在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。目前新模型已在魔搭社区、HuggingFace正式开源。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平