上下文 – 第 2 页 – 冯金伟博客园

DeepSeek-V4发布！迈入百万上下文时代华为昇腾超节点全面支持

《科创板日报》4月24日讯（记者黄心怡）DeepSeek-V4的预览版本今日上线并同步开源。DeepSeek-V4模型上下文处理长度由原有的128K显著扩展至1M，支持百万字超长上下文。同时，输出长 … 继续阅读 DeepSeek-V4发布！迈入百万上下文时代华为昇腾超节点全面支持

henry 鱼羊发自凹非寺量子位 | 公众号 QbitAI 刚刚，DeepSeek-V4来了！预览版正式上线并同步开源。一共两个版本： DeepSeek-V4-Pro：对标顶级闭源模型，1. … 继续阅读 DeepSeek V4终于发布！打破最强闭源垄断，明确携手华为芯片

4月24日，DeepSeek V4-Pro和DeepSeek V4-Flash正式发布并开源，模型上下文处理长度由原有的128K显著扩展至1M，首次增加了KV Cache滑窗和压缩算法，大幅减少Att … 继续阅读昇腾超节点系列产品全面支持DeepSeek V4

4月24日，DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。据介绍，DeepSeek-V4拥有百万字超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领 … 继续阅读 DeepSeek-V4预览版本正式上线并开源

坏了，我写的文章被罗福莉打脸了，结结实实。事情是这样的，小米发布MiMo-V2-Pro的时候，我曾写过一篇文章，叫《在大模型这件事上，雷军居然给马斯克打样了》，在该文的最后一部分对小米提出质疑。我 … 继续阅读我被罗福莉打脸了

编译 | 高远瞩编辑 | 漠影智东西4月23日报道，4月22日，OpenAI正式发布工作区智能体（Workspace Agents），面向ChatGPT商业版、企业版、教育版和教师版用户开放研究预 … 继续阅读 OpenAI推Workspace Agents，GPTs成为过去式

4 月 23 日，腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型，总参数295B，激活参数 21B，最大支持 256K 上下文长度。这是混元重建后训练的第一个 … 继续阅读姚顺雨入职腾讯后首作Hy3 preview模型发布，“混元大模型重建第一步”

财联社4月23日讯（记者付静）腾讯上个月在财报媒体沟通会上预告过的混元大模型（Hunyuan）3.0版本，于今日正式发布。财联社记者从该公司了解到，腾讯混元Hy3 preview语言模型发布并开源 … 继续阅读 Hy3 preview发布混元迈出重建第一步智能体时代腾讯找回节奏

快科技4月23日消息，距离月底只剩下一周时间了，各家大模型最近都有新品或者升级发布，就是DeepSeek V4等得让人心急。 DeepSeek V4最让人期待的还是它这次会用什么新技术让国产AI大模型 … 继续阅读 DeepSeek V4完整技术规格偷跑：1.6万亿参数、1M上下文

每经AI快讯，4月23日，腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型，总参数 295B，激活参数 21B，最大支持 256K 上下文长度。这是混元重建后训 … 继续阅读腾讯混元Hy3 preview发布并开源：混元重建后首个模型