8月12日,腾讯混元发布多模态理解模型混元Large-Vision。它采用MoE架构,激活参数52B,同时支持任意分辨率图像、视频、3D空间输入,重点提升了多语言场景理解能力。
标签: 深度思考模型
OpenAI再次“Open”,开源模型GPT-oss有什么可以学?
界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 过去几个月,OpenAI没有出现过什么激动人心的好新闻:新模型不再惊艳、重要人才流失,就连斥巨资想要收购的明星创业公司Windsurf,也被谷歌截了胡 … 继续阅读 OpenAI再次“Open”,开源模型GPT-oss有什么可以学?
开源!通义千问推出系列中首个图像生成基础模型Qwen-Image
每经AI快讯,据通义千问微信公众号8月5日消息,通义千问宣布开源 Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著 … 继续阅读 开源!通义千问推出系列中首个图像生成基础模型Qwen-Image

