研报指出ღ◈,当前AI大模型的训练ღ◈、推理需求持续旺盛发展ღ◈,scaling law在后训练人生就是博(中国区)集团官方网站ღ◈,ღ◈、在线推理等方向上持续演进ღ◈。底层基础设施朝着更大集群的方向发展ღ◈,单芯片的算力提升在先进制程的影响下未来迭代速度料将放缓ღ◈,而系统级节点有望通过解决互连ღ◈、网络ღ◈、内存墙等问题成为AI算力发展的重要方向ღ◈。从近期算力龙头企业系统级产品的发展趋势以及过往行业的并购历史来看ღ◈,系统级算力有望成为AI发展的下一站ღ◈,国产GPU芯片公司有望通过打造更高资源密度的算力基础设施实现对海外产品的追赶和超越ღ◈。建议关注ღ◈:1)NVL72等系统级产品出货情况ღ◈;2)以华为CloudMatrix384超节点为代表的国产系统级产品进展ღ◈,建议关注国内产业链相关公司福利档ღ◈。

  大模型架构创新以及推理需求的日益增长对底层基础设施建设提出了新的要求ღ◈,面向未来的AI基础设施须具备前瞻性ღ◈、通用性ღ◈。当前ღ◈,单芯片算力提升对算力集群能力提升的边际效应在递减福利档ღ◈,内存通信ღ◈、片间互连ღ◈、网络通信成为瓶颈ღ◈。为解决这一问题ღ◈,技术角度ღ◈,产业迈向Scale up扩展ღ◈,通过提升单节点计算资源密度及高效的网络架构提升算力利用率ღ◈。行业趋势上ღ◈,芯片行业通常以收并购的方式获取技术能力及市场拓展ღ◈,以海外为代表的龙头公司做出了成功示范ღ◈。系统级算力有望成为AI基础设施的下一站ღ◈,建议关注国内以华为CloudMatrix384超节点为代表的产业发展趋势ღ◈。

  我们认为AG尊时凯龙人生就博ღ◈,底层基础设施的通用性就是为了前瞻性地应对未来的模型发展ღ◈。当前AI产业发展迅速ღ◈,Scaling law在后训练ღ◈、在线推理等阶段快速发展ღ◈。训练端凯时官方凯时官方凯时官方ღ◈,模型架构持续创新迭代ღ◈,有望进一步强化训练侧scaling law的延续ღ◈,如阿里巴巴Qwen团队与浙江大学团队提出的Parallel Scalingღ◈、腾讯混元团队采用Transformer福利档凯时官方ღ◈、Mamba混合架构训练的TurboS都取得了优秀的性能表现ღ◈。推理端ღ◈,在MoE专家网络架构成为主流后ღ◈,如何通过硬件部署实现更高的吞吐量和更低的延时成为焦点ღ◈。我们认为ღ◈,采用类似推理集群的形式未来有望成为主流ღ◈,计算节点有望通过提升计算密度满足推理需求人生就是博中国区官方网站ღ◈。系统级算力料将成为下一代AI算力基础设施ღ◈。

  芯片层面ღ◈,算力集群中涉及AI加速芯片ღ◈、CPU芯片ღ◈、Switch互连芯片ღ◈、DPU数据处理芯片等ღ◈,受限制于制程ღ◈,国产AI加速芯片在峰值算力能力领域上相较于海外旗舰产品仍有差距ღ◈,软件生态上亦因产业发展时长而相对落后ღ◈,单芯片能力的竞争并无直接优势ღ◈。互连层面ღ◈,传统PCIe与NVLink等差距较大ღ◈,NVLink5.0提供1.8TB/s双向带宽凯时官方ღ◈,超传统PCIe方案的十倍ღ◈,国产芯片采用自研技术方案助力系统集群发展福利档ღ◈。网络层面ღ◈,系统算力采用RDMA技术实现远程内存访问ღ◈,目前主流技术方案包括InfiniBandღ◈、RoCE等ღ◈。整机层面ღ◈,系统级算力并非是上述部件的简单组装ღ◈,而是通过系统设计ღ◈、规划ღ◈、测试完成的有机整体ღ◈,与以往传统AI服务器相比更需要垂直融合能力ღ◈,产业上下游之间的关系也将随着组件之间耦合程度的提升而变得更加紧密ღ◈。生态层面凯时官方ღ◈,CPU+GPU+互连+网络+整机+系统交付成为系统级算力入局门槛尊龙凯时人生就是博ღ◈,ღ◈,海外巨头通过收并购的方式已构筑起产业生态ღ◈。

  当前ღ◈,单芯片算力能力的发展已显著快于通信领域的发展速度ღ◈,通信效率成为集群效率提升的关键因素ღ◈。构建大集群的方式主要两种ღ◈:1)Scale up(纵向扩展)ღ◈,增加单节点的资源数量ღ◈;2)Scale out(横向扩展)ღ◈,增加节点数量ღ◈。相较于Scale out网络ღ◈,Scale up能够提供更大的带宽ღ◈、更低的通信时延ღ◈,和更大的缓存一致性内存空间ღ◈,因此Scale up即在单节点增加资源数量成为未来发展的重要方向ღ◈,如2024年3月英伟达在2024GTC大会上发布的NVL72系统尊龙凯时(China)人生就是博!ღ◈,ღ◈、2025年4月华为在华为云生态大会上发布的CloudMatrix384超节点为行业发展提供思路ღ◈。

  半导体行业长坡厚雪ღ◈,产业链涉及环节较多且技术复杂ღ◈,整机资源耦合程度提升ღ◈,上下游协作变得愈发紧密福利档AG尊时凯龙人生就博登录ღ◈,ღ◈。因此凯时官方ღ◈,头部企业通常采用投资并购的方式来获取进入市场的机会ღ◈,同时进一步扩展技术能力以巩固市场地位ღ◈。英伟达通过收购Mellanoxღ◈,将原有的NVLink(主要用于Scale up)连接技术ღ◈,扩展至IB等RDMA网络(用于Scale out)ღ◈,从而为下一代大规模计算集群做好技术储备ღ◈;AMD通过收购ZT Systems获取了系统架构设计能力以及数据中心解决方案交付经验ღ◈,EPYC CPU以及Instinct GPUღ◈、网络ღ◈、软件及ZT Systems的集群系统交付能力共同构建了AI解决方案的核心ღ◈。我们总结ღ◈,在面向未来基础设施搭建的领域ღ◈,底层通用性与技术前瞻性是至关重要的ღ◈,在此基础上ღ◈,应用的发展将会随之带来回报ღ◈。

  算力芯片供应链风险ღ◈;芯片产能供给不足的风险ღ◈;互联网大厂资本开支不及预期的风险ღ◈;相关产业政策不及预期的风险ღ◈;AI应用发展不及预期的风险ღ◈;芯片技术迭代不及预期的风险ღ◈;国产GPU厂商竞争加剧的风险等ღ◈。

  当前AI大模型的训练ღ◈、推理需求持续旺盛发展ღ◈,scaling law在后训练ღ◈、在线推理等方向上持续演进ღ◈。底层基础设施朝着更大集群的方向发展ღ◈,单芯片的算力提升在先进制程的影响下未来迭代速度料将放缓ღ◈,而系统级节点有望通过解决互连ღ◈、网络ღ◈、内存墙等问题成为AI算力发展的重要方向ღ◈。从近期算力龙头企业系统级产品的发展趋势以及过往半导体行业的并购历史来看ღ◈,系统级算力有望成为AI发展的下一站ღ◈,国产GPU芯片公司有望通过打造更高资源密度的算力基础设施实现对海外产品的追赶和超越ღ◈。建议关注ღ◈:1)英伟达NVL72等系统级产品出货情况ღ◈;2)以华为CloudMatrix384超节点为代表的国产系统级产品进展ღ◈,建议关注国内产业链相关公司ღ◈。


上一篇 : d88尊龙人生就是博|ribenrenti|人工智能正悄然改变时尚创意
下一篇: 没有了


尊时凯龙·(中国区)人生就是搏!| http://www.dalianjingsheng.com