目录
- Dell 10U风冷B300/MI355X GPU服务器
- SuperMicro 8U风冷B300服务器
- 3U 21”宽液冷GPU服务器:PowerEdge XE9785L
接前文《HGX B200液冷AI服务器中的NVLink & PCIe Switch应用》。
今天给大家介绍HGX B300服务器,有些也能支持AMD最新的Instinct MI355XGPU。我在《ODCC大会现场的GPU服务器 & AI超节点》中提到过B300 NVL,但那个只是PCIe插卡形态的,如今更受关注的显然是SXM接口的OAM模块。
Dell 10U风冷B300/MI355X GPU服务器
下面我们先来看Dell PowerEdge服务器的2款新机型:XE9785和XE9780。由于过去的XE9680等产品的评价还不错,我对该系列保持着关注。
首先,这2款GPU服务器都是10U风冷机箱,XE9785和XE9780使用的CPU分别为AMD EPYC 9005(兼容标准“性能”核 & 高密度核)和6th Intel Xeon Scalable(最多86核的P-Core系列)。
系统内存插槽的支持,XE9785是每颗EPYC CPU 12个通道的1 DPC(DIMM per Channel)设计,总共24插槽;而XE9780则有32个插槽,因为LGA4710 Socket的Xeon 6是8通道内存控制器,2 DPC设计能插的内存总条数更多,但牺牲了频率和带宽,印象中应该是跑到DDR5-5200。
GPU部分,Intel CPU的XE9780可支持NVIDIA HGX B200或B300;XE9785则是支持HGX B300或者Instinct MI355X。这份文档里看来有点文字错误:B300的规格应该统一为270GB显存和SXM7;只有功耗这一点,在XE9785上是否能提高到1200W?我在下文中会举出更多论据。AMD MI355X的288GB 1400W OAM则与官方值一致。
PCIe插槽方面,看似在B300配置下只有4个Gen5 x16;而配MI355X和B200时要多出8个插槽?这一点其实是因为“Scale-out”网卡的支持不同:在“Embedded OSFP”一栏,B300默认会绑定8个CX8网卡。
对于以上这种设计,其实我之前已有了解,下面就列出从哪里知道的。另外,B300服务器能否像传统的MI355X以及B200那样对Scale-out网络提供开放的PCIe标卡支持?在本文后续的讨论中也有答案。
SuperMicro 8U风冷B300服务器
上图是超微的HGX B300 AI服务器,就以提供手册的AS -8126GS-NB3RT(AMD CPU)机型为例,也是配置了8个CX-8网卡。8U的尺寸比前面Dell机型要小一些,相应的NVMe SSD盘位、PCIe插槽也是少一些。
在上面图表中,提到了SuperMicro这款服务器的PCIe插槽是从PLX(Broadcom)Switch引出的。
扩展阅读:《展望2026:国产PCIe 6.0和UALink Switch都将量产?》
虽然我还没有Dell XE978x机型的进一步资料,但如上图:从SuperMicro的文档中,可以看到CX8网卡在机箱中的位置。由于CX8集成了48 lane的PCIe Switch,我理解应该是服务器CPU和GPU都同时连接到CX8。(这里如有错误,还望读者朋友们不吝指正)
SuperServer AS -8126GS-NB3RT System Block Diagram
关于GPU Connection,上面的架构图其实只画出了CPU到BPN-GPU-GP807板之间的连接这部分。
我只能先猜测Dell XE9780和XE9785还使用CX8同时连接了NVMe SSD?对于SuperMicro AS -8126GS-NB3RT,由于支持的SSD数量相对较少,每颗AMD EPYC 9005/9004系列CPU各连接了一个PEX 89072(72 lane)PCIe Switch,然后来支持E1.S SSD背板,以及PCIe扩展槽(支持BF3或者别的网卡)。
由此,我估计Dell XE978x在B300+CX8配置时应该也会有PCIe Switch,但不用像以前XE9685L、XE7745那样需要PEX89144、PEX89104这些较高端(大型多端口数)的芯片。
扩展阅读《DeepSeek时代:关于AI服务器的技术思考(PCIe篇)》
H14DSG-OM主板照片
在超微这款主板上,很容易看出2颗PEX 89072 PCIe Switch芯片的位置。
除了B300,SuperMicro也提供“DP AMD 8U System with AMD Instinct MI325X/MI350X 8-GPU”的AI服务器,机型名称是GPU A+ Server AS -8126GS-TNMR。
3U 21”宽液冷GPU服务器:PowerEdge XE9785L
在Dell最新这一波AI服务器中,目前公布的液冷机型只有AMD CPU的XE9785L。规格表如下:
这里再次出现了B300 1200W的描述,是不是有点不太像“笔误”了?尽管NVIDIA文档中HGX B300的Max TDP为1100W,搞不好在液冷and/or散热较好的AI服务器上可以提高一些功耗?
XE9785L使用(冷板)液冷的组件包括CPU、GPU和NVLink Switch。它的机箱尺寸为适配21英寸Open Rack的3OU,上面文档中写了需要Dell的IR7000机柜(在《风冷、液冷GPU服务器密度提升 - PowerEdge 17G整机架预览 (2)》中曾有介绍)。
Dell之前的XE9680L和9685L液冷服务器,是4U 19英寸标准机箱容纳8个OAM GPU,与《Meta的GB200液冷AI服务器 - Catalina》1OU 2颗B200的密度大致相仿。3OU 8个GPU的XE9785L新品,则在x86 AI服务器中提供了另一种密度较高的选择。
XE9785L统一支持12个PCIe Gen5 x16插槽,包括在B300配置时也没有默认绑定CX8网卡,这一点与风冷机型XE9785是不同的。
今天先分享到这里吧,希望对大家有帮助:)
参考资料
https://www.delltechnologies.com/asset/en-us/products/servers/technical-support/poweredge-xe-ai-spec-sheet.pdf
https://www.supermicro.org.cn/en/products/system/gpu/8u/as%20-8126gs-nb3rt
注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)
尊重知识,转载时请保留全文。感谢您的阅读和支持!
更新时间:2025-10-13
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 61893.com 闽ICP备11008920号
闽公网安备35020302035593号