9月22日,美团LongCat团队正式发布全新高效推理模型LongCat-Flash-Thinking。LongCat-Flash-Thinking同时具备「深度思考+工具调用」与「非形式化+形式化」 … Continue reading 美团发布高效推理模型LongCat-Flash-Thinking
标签: thinking
阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列
阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列:改进混合注意力机制、高稀疏度MoE结构 IT之家 9 月 12 日消息,阿里云通义团队今日宣布推出其下一代基础模型架构 Qwen … Continue reading 阿里云发布通义Qwen3-Next基础模型架构并开源80B-A3B系列
实测GPT-5:写作坠入谷底,编程一骑绝尘
凌晨1点,在万众瞩目的境况下,OpenAI的直播正式开始。 GPT-5,终于来了。 AI走的太快,快到才2年半的时间,就像是过去了10年。 2023年3月15日,GPT-4发布。在那个莽荒年代里,所有 … Continue reading 实测GPT-5:写作坠入谷底,编程一骑绝尘