8月26日,阿里云大模型服务平台百炼发布部分模型上下文缓存降价通知,本次调价后,当请求部分模型命中缓存时,命中的输入Token将按cached_token计费,单价从调价前input_token单价的 … Continue reading 阿里云百炼宣布部分模型上下文缓存降价
标签: 上下文
硅基流动:上线DeepSeek-V3.1,上下文升至160K
据硅基流动消息,8月25日,硅基流动大模型服务平台上线深度求索团队最新开源的DeepSeek-V3.1。DeepSeek-V3.1总参数共671B,激活参数37B,采用混合推理架构(同时支持思考模式与 … Continue reading 硅基流动:上线DeepSeek-V3.1,上下文升至160K
字节首次开源推理模型,连夺7项第一
作者 | 陈骏达 编辑 | 心缘 智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业 … Continue reading 字节首次开源推理模型,连夺7项第一
刚刚,字节开源Seed-OSS-36B模型,512k上下文
开源赛道也是热闹了起来。 就在深夜,字节跳动 Seed 团队正式发布并开源了 Seed-OSS 系列模型,包含三个版本: Seed-OSS-36B-Base(含合成数据) Seed-OSS-36B-B … Continue reading 刚刚,字节开源Seed-OSS-36B模型,512k上下文
DeepSeek小更新,多步推理表现提高43%
就在刚才,DeepSeek在官方微信群发出通知,线上模型版本已升级至 V3.1,上下文长度拓展至128k。 DeepSeek V3.1就是DeepSeek V3在2025年3月25号更新的0324版本 … Continue reading DeepSeek小更新,多步推理表现提高43%
DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging F … Continue reading DeepSeek开源新基础模型,但不是V4,而是V3.1-Base
DeepSeek线上模型版本升级至V3.1
DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。
DeepSeek线上模型版本升级至V3.1
每经AI快讯,8月19日,记者注意到,DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。
DeepSeek线上模型版本升级至 V3.1
《科创板日报》19日讯,《科创板日报》记者注意到,DeepSeek线上模型版本已升级至V3.1,上下文长度拓展至128k。(记者 黄心怡)
阿里通义千问:多个产品升级,Qwen-Image图片编辑模型即将上线
8月15日,通义千问宣布,Qwen3 100万tokens上下文再拓展、Qwen Chat Deep Reseache再升级、ComfyUI上线Qwen-Image distilled。此外,Qwen … Continue reading 阿里通义千问:多个产品升级,Qwen-Image图片编辑模型即将上线