DeepSeek-V3.1正式发布 UE8M0 FP8技术助力国产芯片加速追赶

据DeepSeek官方公众号消息，DeepSeek-V3.1正式发布。DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到，DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。DeepSeek官微在置顶留言里表示，UE8M0 FP8是针对即将发布的下一代国产芯片设计。

FP8是Float8的简称，即用8位二进制数表示浮点数，主要用于深度学习的训练和推理。相比传统的FP32（32位浮点数）或FP16（16位浮点数），FP8显著降低了显存占用和计算资源需求，同时通过优化设计（如动态范围调整）维持了较高的精度。‌‌FP8对国产芯片的使用效率提升显著，将进一步缩小与NV芯片的效率/成本差距，大大增加国产芯片的可用性。

有机构指出，DeepSeek-V3.1 采用UE8M0 FP8 Scale，国产AI芯片-国产开源模型-下游应用，国产AI生态全方面闭环。当前国产AI芯片正处于技术突破与生态落地的关键窗口期，UE8M0 FP8助力国产芯片加速追赶。‌‌

据财联社主题库显示，相关上市公司中：

和而泰持有摩尔线程1.244%股份。摩尔线程是首个支持原生FP8的国产GPU厂商，基于全新MUSA Compute Capability 3.1计算架构，可提供原生FP8计算能力。

芯原股份用于高性能Transformer推理的NPU芯原VIP9000支持FP8技术，能让客户在云端完成FP8训练后，直接快速部署到支持FP8的硬件中。

DeepSeek-V3.1正式发布 UE8M0 FP8技术助力国产芯片加速追赶

Published by

风君子

最新文章

标签

书签