AI时代网络需求爆发 探寻行业创新与投资机遇

robot
摘要生成中

AI时代的网络:需求源头与创新方向

网络在AI大模型时代扮演着关键角色。随着大模型规模的快速增长,网络设备如光模块、交换机等迎来需求爆发和迭代加速。本文将从原理出发,探讨网络为何成为AI时代的新焦点,并讨论产业变化中网络侧的创新与投资机会。

1. 网络需求的来源

进入大模型时代,模型规模与单卡上限差距迅速扩大,多服务器集群成为解决模型训练的必然选择,这构成了AI时代网络重要性提升的基础。与过去单纯用于数据传输不同,网络现在更多用于同步显卡间的模型参数,对网络密度和容量提出了更高要求。

1.1 日益庞大的模型规模

训练耗时 = 训练数据规模 × 模型参数量 / 计算速率 计算速率 = 单设备计算速率 × 设备数 × 多设备并行效率

在对训练数据规模和参数的双重追求下,只有加速提升计算效率,才能缩短训练耗时。单设备计算速率的提升存在周期和限制,因此如何利用网络扩大"设备数"和"并行效率"直接决定了算力水平。

1.2 多卡同步的复杂沟通

在大模型训练过程中,将模型切分至单卡后,每次计算后单卡之间都需要进行对齐。在NCCL等通信原语中,All-to-All等操作较为常见,这对网络传输和交换提出了更高要求。

1.3 昂贵的故障成本

大模型训练往往持续数月,中断后需回到断点重新训练。网络中任一环节的故障或高延迟都可能导致中断,增加成本和延长进度。现代AI网络已发展成堪比飞机、航母等的复杂系统工程。

2. 网络创新的方向

经过两年发展,全球算力投资规模已达数百亿美元级别。模型参数持续扩张,巨头间竞争依然激烈。当前,"降本"、"开放"和算力规模平衡成为网络创新的主要议题。

2.1 通信介质的更迭

光、铜与硅是主要传输介质。AI时代,光模块在追求更高速率同时,也通过LPO、LRO、硅光等方案降低成本。铜缆凭借性价比和低故障率占据机柜内连接优势。Chiplet、Wafer-scaling等新技术正在探索硅基互联的上限。

2.2 网络协议的竞争

片间通信协议与显卡强绑定,如NVLINK、Infinity Fabric等,决定了单节点算力上限,是巨头间的激烈战场。IB与以太网的竞争则是节点间通信的主旋律。

2.3 网络架构的变化

当前节点间网络普遍采用叶脊架构,具有便捷、简单、稳定等优势。但随着单集群节点数增多,叶脊架构在超大集群中显得冗余,带来较大网络成本。Dragonfly架构、rail-only架构等新方案有望成为面向下一代超大集群的演进方向。

3. 投资建议

通信系统核心环节:中际旭创、新易盛、天孚通信、沪电股份。

通信系统创新环节:长飞光纤、中天科技、亨通光电、盛科通信。

4. 风险提示

  1. AI需求不及预期
  2. Scaling law失效
  3. 行业竞争加剧
ETH-0.52%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 5
  • 分享
评论
0/400
Layer2观察员vip
· 15小时前
别扯了 显卡厂商在暗中狂喜
回复0
链上资深福尔摩斯vip
· 17小时前
公链上随便混混吧 被割被教育也习惯了
回复0
币圈鸡汤哥vip
· 17小时前
搞机会啦兄弟们!
回复0
社区混子王vip
· 17小时前
炒来炒去 还是炒网络
回复0
ShadowStakervip
· 17小时前
唉... 网络拓扑还没有准备好承载这个人工智能的负载,老实说
查看原文回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)