DeepSeek-V3.1正式发布 UE8M0 FP8技术助力国产芯片加速追赶

DeepSeek官方公众号消息,DeepSeek-V3.1正式发布。DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。DeepSeek官微在置顶留言里表示,UE8M0 FP8是针对即将发布的下一代国产芯片设计。

FP8是Float8的简称,即用8位二进制数表示浮点数,主要用于深度学习的训练和推理。相比传统的FP32(32位浮点数)或FP16(16位浮点数),FP8显著降低了显存占用和计算资源需求,同时通过优化设计(如动态范围调整)维持了较高的精度。‌‌FP8对国产芯片的使用效率提升显著,将进一步缩小与NV芯片的效率/成本差距,大大增加国产芯片的可用性。

有机构指出,DeepSeek-V3.1 采用UE8M0 FP8 Scale,国产AI芯片-国产开源模型-下游应用,国产AI生态全方面闭环。当前国产AI芯片正处于技术突破与生态落地的关键窗口期,UE8M0 FP8助力国产芯片加速追赶。‌‌

据财联社主题库显示,相关上市公司中:

和而泰持有摩尔线程1.244%股份。摩尔线程是首个支持原生FP8的国产GPU厂商,基于全新MUSA Compute Capability 3.1计算架构,可提供原生FP8计算能力。

芯原股份用于高性能Transformer推理的NPU芯原VIP9000支持FP8技术,能让客户在云端完成FP8训练后,直接快速部署到支持FP8的硬件中。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平