《科创板日报》4月24日讯(记者 黄心怡)DeepSeek-V4的预览版本今日上线并同步开源。DeepSeek-V4模型上下文处理长度由原有的128K显著扩展至1M,支持百万字超长上下文。同时,输出长 … 继续阅读 DeepSeek-V4发布!迈入百万上下文时代 华为昇腾超节点全面支持
标签: 上下文
DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
henry 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,DeepSeek-V4来了! 预览版正式上线并同步开源。 一共两个版本: DeepSeek-V4-Pro:对标顶级闭源模型,1. … 继续阅读 DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
昇腾超节点系列产品全面支持DeepSeek V4
4月24日,DeepSeek V4-Pro和DeepSeek V4-Flash正式发布并开源,模型上下文处理长度由原有的128K显著扩展至1M,首次增加了KV Cache滑窗和压缩算法,大幅减少Att … 继续阅读 昇腾超节点系列产品全面支持DeepSeek V4
DeepSeek-V4预览版本正式上线并开源
4月24日,DeepSeek全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。据介绍,DeepSeek-V4拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领 … 继续阅读 DeepSeek-V4预览版本正式上线并开源
我被罗福莉打脸了
坏了,我写的文章被罗福莉打脸了,结结实实。 事情是这样的,小米发布MiMo-V2-Pro的时候,我曾写过一篇文章,叫《在大模型这件事上,雷军居然给马斯克打样了》,在该文的最后一部分对小米提出质疑。 我 … 继续阅读 我被罗福莉打脸了
OpenAI推Workspace Agents,GPTs成为过去式
编译 | 高远瞩 编辑 | 漠影 智东西4月23日报道,4月22日,OpenAI正式发布工作区智能体(Workspace Agents),面向ChatGPT商业版、企业版、教育版和教师版用户开放研究预 … 继续阅读 OpenAI推Workspace Agents,GPTs成为过去式
姚顺雨入职腾讯后首作Hy3 preview模型发布,“混元大模型重建第一步”
4 月 23 日,腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数295B,激活参数 21B,最大支持 256K 上下文长度。这是混元重建后训练的第一个 … 继续阅读 姚顺雨入职腾讯后首作Hy3 preview模型发布,“混元大模型重建第一步”
Hy3 preview发布 混元迈出重建第一步 智能体时代腾讯找回节奏
财联社4月23日讯(记者 付静)腾讯上个月在财报媒体沟通会上预告过的混元大模型(Hunyuan)3.0版本,于今日正式发布。 财联社记者从该公司了解到,腾讯混元Hy3 preview语言模型发布并开源 … 继续阅读 Hy3 preview发布 混元迈出重建第一步 智能体时代腾讯找回节奏
DeepSeek V4完整技术规格偷跑:1.6万亿参数、1M上下文
快科技4月23日消息,距离月底只剩下一周时间了,各家大模型最近都有新品或者升级发布,就是DeepSeek V4等得让人心急。 DeepSeek V4最让人期待的还是它这次会用什么新技术让国产AI大模型 … 继续阅读 DeepSeek V4完整技术规格偷跑:1.6万亿参数、1M上下文
腾讯混元Hy3 preview发布并开源:混元重建后首个模型
每经AI快讯,4月23日,腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数 295B,激活参数 21B,最大支持 256K 上下文长度。这是混元重建后训 … 继续阅读 腾讯混元Hy3 preview发布并开源:混元重建后首个模型

