性能大降接近25%,英伟达公布两款消费级“中国特供版”芯片,以应对美国禁令

原文来源:钛媒体

图片来源:由无界 AI生成

为了满足美国对华芯片出口管制要求,老黄可谓是“煞费苦心”、“刀法精湛”。

1月6日消息芯片巨头英伟达(NVIDIA)日前悄悄在官网上线英伟达RTX 5880 Ada工作站显卡,主要面向消费级和 AI 训推等专业领域应用的芯片产品。

相比旗舰级RTX 6000,英伟达RTX 5880在性能方面大幅降级,采用阉割的AD102 GPU,拥有14080 CUDA 核心,比RTX 6000的18176个CUDA核心数量减少22%,单精度浮点性能降低24%左右,整体性能减少接近1/4,实际表现或接近次旗舰性能的RTX 5000。

英伟达RTX 6000、5880、5000显卡之间的对比

在此之前的2022年底,英伟达也正式推出了传闻已久、减量不减价的“中国特供版”消费级旗舰显卡——RTX 4090 D,AI 性能大降10%,售价依然是12999元起。

钛媒体App了解到,截至目前,国内已经有部分服务器代理商拿到4090D样品和测试版显卡。

而如今,英伟达在其官网正式发布RTX 5880 Ada,这表明现已开始接受客户购买该产品。值得注意的是,尽管英伟达官方没有称RTX 5880专门针对中国市场,在全球市场都有展示和销售,但鉴于整体采用与4090D一样的“阉割版”性能减配方法,因此有理由相信,RTX 5880 Ada就是旨在规避美国商务部发布的半导体出口管制限制措施的产品。

“我们成立公司就是为了做生意,努力与所有可能的人做生意。”英伟达CEO黄仁勋日前表示,该公司将继续“完美”遵守贸易法规,并为中国市场提供一套符合美国政府最新规定的新产品。他补充称,英伟达需要寻求市场的建议,这一过程正在进行中。

2023年12月6日,在美国商务部长雷蒙多(Gina Raimondo)已公开示警下,黄仁勋证实将继续为中国市场提供合规芯片产品,预计“特供”芯片将包括HGX H20、L20 PCle、L2 PCle等产品,

随后,英伟达中国在官网发布GeForce RTX 4090 D——专为应对美国“芯片禁令”而定制的版本,性能低于美国出口管制规定限制标准。

如今,英伟达RTX 5880 Ada也正式发布。规格方面,英伟达RTX 5880 Ada显卡拥有14080个CUDA内核和440个Tensor内核,主频约为2.5 GHz,具有69.3 TFLOPs的FP32计算能力和1108 TFLOPs 的Tensor性能,与RTX 6000 Ada相比FP32 和张量核心性能降低24%;显存方面,RTX 5880采用了48 GB GDDR6显存,运行速度为20 Gbps,带宽达960 GB/s,采用标准的双插槽主动冷却设计,拥有四个DisplayPort 1.4a 输出端口。

虽然英伟达没有透露RTX 5880定价信息,但预计,RTX 5880 Ada 的价格将与RTX 6000相近,售价应该在6800美元左右(约合4.83万元人民币)。

对于英伟达消费级RTX 5880和4090D显卡是否能够用于 AI 模型训练和推理,有行业人士向钛媒体App透露,显卡进行大规模 AI 训练主要看算力、显存和带宽能力,而RTX 5880和4090D在单精度算力方面整体优秀,但显存和带宽限制较多,无法训练GPT这种700TB/万亿级参数模型,但对于Llama 2-7B、13B这类小参数模型,单卡4090D就可以稳定运行,如果8张4090D结合起来,还可训练70亿-650亿参数模型。推理方面,基于Ada架构和CUDA软件,RTX 5880和4090D都可稳稳运行,尤其在 AI 图形渲染和视频生成方面属于“王牌水平”。

目前来看,英伟达RTX 5880和4090D显卡将成为国内企业极少能买到的性能强劲、能稳定运行 AI 模型训练推理的算力芯片产品。

另据《参考消息》报道称,英伟达将恢复中国“特供版”AI芯片出货,预计2024年第二季度将开始量产H20和其他数据中心领域的 AI 算力芯片。雷蒙多已表示,美国可以允许英伟达有限度地向中国出售 AI 芯片,但不允许英伟达出口最复杂、处理能力最强的 AI 芯片。