本站11月14日消息,NVIDIA Blackwell GPU相当强悍,大家都知道,但到底有多强呢?
除了官方宣传数据,现在终于第一次看到了实测数据,来自MLCommons MLPerf v4.1,考察AI训练推理性能的最佳平台。
对比对象是两代服务器HGX B200、HGX H200,前者包含多达八颗Blackwell GPU B200,单颗功耗高达1000W。
GPT-3预训练项目中,Blackwell的性能相比上代Hopper翻了一番。
Llama 2 700亿参数微调项目中,Blackwell的性能更是提升了多达2.2倍。
值得一提的是,Blackwell平台具备ConnectX-7 SuperNICs网卡、Quantum-2 InfiniBand交换机,再加上第五代NVLink互连总线,可以充分保障节点间的通信,可以平衡分配AI训练负载,整体效率更高。
比如同样的GPT-3 1750亿参数性能,Hopper需要多达256颗GPU,Blackwell就只需要64颗。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:goldenhorseconnect@gmail.com