- RubinCPX是NVIDIA为解决百万Token推理需求而推出的专用加速处理器,旨在提升超长上下文场景的计算效率与能效。
- 该产品通过上下文分析与生成任务的分工,优化算力利用率,预计在2026年底上市,整体性能显著提升。
- RubinCPX的推出将推动算力基础设施进入新阶段,相关产业链公司有望受益,长期成长空间更加明晰。
核心要点2
报告主要分析了NVIDIA即将推出的RubinCPX处理器,旨在解决生成式AI中“百万Token”推理的需求。
随着生成式AI的普及,行业对长上下文的需求急剧上升,但现有GPU在处理超长上下文时存在内存带宽瓶颈和计算冗余,导致算力利用率不足。
RubinCPX作为专用加速处理器,针对上下文分析和生成任务进行优化,提升吞吐量和能效。
RubinCPX的设计目标是通过硬件与架构优化,支持高通量的上下文处理,并与RubinGPU和VeraCPU协同工作,形成高效的推理平台。
其单卡算力约为30PFLOPS,搭载128GB显存,整体系统性能达到8ExaFLOPS,显著提升上下文处理效率。
从产业角度看,RubinCPX的推出标志着算力基础设施进入新阶段,推动百万Token推理和长视频生成成为AI应用的标准需求,相关硬件和软件的耦合度提高,产业链的价值量上升。
预计RubinCPX将在2026年底上市,相关公司如PCB、光芯片及服务器代工等将受益。
风险提示包括供应链波动、下游需求不及预期和行业竞争加剧。
投资标的及推荐理由投资标的及推荐理由: 1. PCB/CCL相关公司: - 沪电股份 - 胜宏科技 - 生益电子 - 深南电路 - 景旺电子 - 广合科技 - 生益科技 - 南亚新材 推荐理由:随着RubinCPX的推出,相关PCB和CCL厂商将受益于算力基础设施的升级和需求增加。
2. 铜缆相关公司: - 沃尔核材 - 博创科技 - 华丰科技 推荐理由:长上下文推理的需求增长将推动铜缆相关产品的市场需求,相关公司有望获得发展机会。
3. 光芯片/光器件相关公司: - 博创科技 - 仕佳光子 - 太辰光 - 长光华芯 - 源杰科技 推荐理由:随着算力基础设施的升级,对光芯片和光器件的需求将增加,相关公司将受益。
4. 服务器代工相关公司: - 工业富联 - 华勤技术 推荐理由:RubinCPX的量产和落地将推动服务器代工市场的发展,相关公司有望获得订单增长。
总体来看,RubinCPX的推出将加速全球算力需求释放,产业链相关公司的中长期成长空间将更加清晰。