4 月 6 日消息,2020 年,赛灵思发布了其首款“一体化 SmartNIC(智能网卡)平台”——Alveo U25 的数据中心加速卡,在单颗器件上实现了网络、存储和计算加速功能的融合。
作为 Xilinx Alveo 系列的后继产品,AMD 今天推出了一款新的数据中心专用加速卡 ——Alveo MA35D。与 Alveo U30 一样,MA35D 是专为数据中心设计的纯视频编码卡,目前已经向其合作伙伴提供了样品。
简单来说,最新一代的 Alveo 加速卡有着比其前身更显著的性能优势,它可实现四倍的最大同时视频流(simultaneous video streams),同时还增加了 AV1 和 8K 分辨率编码支持。
这款加速卡主要客户是直播媒体服务和其他交互式视频服务 (例如直播、云游戏、视频会议等),所有这些都需要在服务器环境中实时同时对大量视频流进行编码。
该公司预计新品将在今年第三季度开始出货,参考价 1595 美元(备注:当前约 10974 元人民币)。
说回到 Alveo MA35D 硬件本身,上一代 Alveo U30 仅支持 H.264 和 H.265 编码,最多可以编码 8 个 1080p 流,而 Alveo MA35D 则扩展到 32 个 1080p 流,同时加入了对最新一代 AV1 编解码器的支持,而且最大分辨率已从 4K 提升到 8K。
该卡的核心是 AMD 未命名的视频编码 ASIC,他们称其为视频处理单元 (VPU)。
据悉,MA35D 包含两个 vpu 部分,每个 vpu 都有一颗 8GB LPDDR5 芯片,并通过 PCIe 5.0 x4 连接到处理器。值得一提的是,这里的 VPU 基于 5nm 工艺制造,但奇怪的是 AMD 没有透露代工厂,所以我们认为可能是三星 5nm 工艺。
每个 VPU 部分包含 4 个视频编码块,并增加了使其成为一个全功能芯片所需的各种附件块,其中两个全功能编码块支持 H.264, H.265 和 AV1,而另外两个仅适用于 AV1。
此外,VPU 上还包括用于转码的视频解码器模块、内存控制器、管理控制器、比特率缩放器、组合引擎和 22 TOPS 吞吐量 AI 处理器,以进一步提高卡的视频编码质量。
与旧的 U30 卡相比,能源效率是另一个主要的优势,AMD 认为这也是他们在竞争中的一个重要优势。该卡的正式 TDP 是 50 瓦,但实际上 AMD 发现该卡的典型功耗接近 35 瓦,或者在 1080p60 的情况下每流略高于 1W。与 U30 相比,这一数据流的能耗降低了 66%,而 U30 对于单个 1080p 数据流的能耗略高于 3W。
同时,新的肺泡 MA35D 及其 VPU 是一个 AI 加速块。与基于 GPU 的产品不同,这不是用于图像识别等准相关的人工智能任务; 相反,AMD 正在使用 AI 加速器将额外的数据输入他们的视频编码器,以进一步提高编码质量,它采用了 RISC-V 设计,AI 处理器的性能额定为 22 TOPS。
与上一代 U30 相比,能效是这款加速卡的另一个优势。该卡 TDP 仅有 50 瓦,但实际上典型功耗约为 35 瓦,而在 1080p 60 帧的情况下略高于 1W。与 U30 相比,这一数据足足降低了 66%。
这款卡可完全通过 PCIe 插槽实现供电,只需要使用 PCIe x8 连接器 (每个 VPU 分至 x4) 即可,而且 MA35D 采用了被动散热。
与基于 GPU 的产品不同,AMD 正在使用 AI 加速器将额外的数据输入他们的视频编码器,以进一步提高编码质量。这里的 AI 处理器的性能为 22 TOPS,可以逐帧评估流,然后使用该分析来调整芯片其余部分使用的编码参数。
此外,AMD Alveo MA35D 有着相对激进的图像质量要求。AMD 表示,MA35D 可以在 H.264 模式下以 55% 的比特率 (效率提高 1.8 倍) 提供与 Alveo U30 相同的图像质量。