推理专用芯片RubinCPX重磅发布,产业链迎来新机遇

专栏头像

科技先锋

英伟达发布推理专用芯片Rubin CPX,成本效益较高

AI推理过程包含两个重要阶段:Prefill阶段与Decode阶段,这两个阶段对AI基础设施的需求存在本质差异。其中,Prefill阶段更多强调算力,其需要通过高吞吐量处理来接收并分析大量输入数据,进而生成首个token输出结果,可以理解为在拥有?量昂贵且带宽很?的HBM的芯片上运行Prefill是?种浪费;Decode阶段强调内存带宽,需依赖高速内存传输及NVLink等高速互联方案,以维持逐推理单元(token-by-token)的输出性能。

英伟达专为大规模上下文AI模型设计的GPU Rubin CPX重磅发布,单芯?的 Rubin CPX在设计上更强调计算FLOPS??内存带宽,其可提供20 PFLOPS的 FFP4密集计算能?,但只有2TB/s的内存带宽,还配备128GB的GDDR7内存,与VR200相?这是较少且更便宜的内存,从HBM切换到更便宜的GDDR7内存,使每GB成本降低超过50%。

Rubin CPX带来Rubin家族新架构,产业链迎来新机遇

Rubin CPX的推出将VR200服务器机架扩展为三种版本:

(1) VR200 NVL144:18个computer tray合计72个GPU,每个computer tray中有4个R200 GPU。

(2) VR200 NVL144 CPX:在18个computer tray中,除了144个Rubin CPX GPU外还有72个R200 GPU,每个computer tray包含4个R200 GPU和8个Rubin CPX GPU。

(3) Vera Rubin CPX双机架:两个独?机架,?个VR200 NVL144机架加上?个VR CPX机架,VR CPX机架共包含18个computer tray,每个computer tray包含8个Rubin CPX GPU。

新架构有望给产业链带来新增量,机柜内芯片的互联以及机柜外网络互联都将变得复杂,对PCB以及铜缆连接器等的需求进一步增加。

投资建议:建议关注PCB、铜缆连接器、组装等环节

由于机架结构的变化,CPX芯片部分新增PCB承接,机柜内的互联也更加复杂,有望给铜缆连接器环节带来新增量。

PCB环节受益标的:沪电股份胜宏科技深南电路生益电子景旺电子鹏鼎控股广合科技方正科技世运电路奥士康生益科技等; 铜缆连接器环节受益标的:华丰科技沃尔核材鼎通科技等; 组装环节受益标的:工业富联等。

风险提示:Rubin CPX放量节奏不及预期;产业链配套节奏不及预期。

以上内容节选自【开源证券】已经发布的研究报告《推理专用芯片RubinCPX重磅发布,产业链迎来新机遇》及公开信息,具体分析内容(包括风险提示等)请详见完整版报告。若因对报告的摘编产生歧义,应以完整版报告内容为准。

展开阅读全文