英伟达发布推理专用芯片Rubin CPX,成本效益较高AI推理过程包含两个重要阶段:Prefill阶段与Decode阶段,这两个阶段对AI基础设施的需求存在本质差异。其中,Prefill阶段更多强调算力,其需要通过高吞吐量处理来接收并分析大量输入数据,进而生成首个token输出结果,可以理解为在拥有⼤量昂贵且带宽很⾼的HBM的芯片上运行Prefill是⼀种浪费;Decode阶段强调内存带宽,需依赖高速内存传输及NVLink等高速互联方案,以维持逐推理单元(token-by-token)的输出性能。英伟达专为大规模上下文AI模型设计的GPU Rubin CPX重磅发布,单芯⽚的 Rubin CPX在设计上更强调计算FLOPS⽽⾮内存带宽,其可提供20 PFLOPS的 FFP4密集计算能⼒,但只有2TB/s的内存带宽,还配备128GB的GDDR7内存,与VR200相⽐这是较少且更便宜的内存,从HBM切换到更便宜的GDDR7内存,使每GB成本降低超过50%。Rubin CPX带来Rubin家族新架构,产业链迎来新机遇Rubin CPX的推出将VR200服务器机架扩展为三种版本:(1) VR200 NVL144:18个computer tray合计72个GPU,每个computer tray中有4个R200 GPU。(2) VR200 NVL144 CPX:在18个computer tray中,除了144个Rubin CPX GPU外还有72个R200 GPU,每个computer tray包含4个R200 GPU和8个Rubin CPX GPU。(3) Vera Rubin CPX双机架:两个独⽴机架,⼀个VR200 NVL144机架加上⼀个VR CPX机架,VR CPX机架共包含18个computer tray,每个computer tray包含8个Rubin CPX GPU。新架构有望给产业链带来新增量,机柜内芯片的互联以及机柜外网络互联都将变得复杂,对PCB以及铜缆连接器等的需求进一步增加。投资建议:建议关注PCB、铜缆连接器、组装等环节由于机架结构的变化,CPX芯片部分新增PCB承接,机柜内的互联也更加复杂,有望给铜缆连接器环节带来新增量。PCB环节受益标的: 沪电股份 、 胜宏科技 、 深南电路 、 生益电子 、 景旺电子 、 鹏鼎控股 、 广合科技 、 方正科技 、 世运电路 、 奥士康 、 生益科技 等; 铜缆连接器环节受益标的: 华丰科技 、 沃尔核材 、 鼎通科技 等; 组装环节受益标的: 工业富联 等。风险提示:Rubin CPX放量节奏不及预期;产业链配套节奏不及预期。