AI時代網路需求爆發 探尋行業創新與投資機遇

robot
摘要生成中

AI時代的網路:需求源頭與創新方向

網路在AI大模型時代扮演着關鍵角色。隨着大模型規模的快速增長,網路設備如光模塊、交換機等迎來需求爆發和迭代加速。本文將從原理出發,探討網路爲何成爲AI時代的新焦點,並討論產業變化中網路側的創新與投資機會。

1. 網路需求的來源

進入大模型時代,模型規模與單卡上限差距迅速擴大,多服務器集羣成爲解決模型訓練的必然選擇,這構成了AI時代網路重要性提升的基礎。與過去單純用於數據傳輸不同,網路現在更多用於同步顯卡間的模型參數,對網路密度和容量提出了更高要求。

1.1 日益龐大的模型規模

訓練耗時 = 訓練數據規模 × 模型參數量 / 計算速率 計算速率 = 單設備計算速率 × 設備數 × 多設備並行效率

在對訓練數據規模和參數的雙重追求下,只有加速提升計算效率,才能縮短訓練耗時。單設備計算速率的提升存在週期和限制,因此如何利用網路擴大"設備數"和"並行效率"直接決定了算力水平。

1.2 多卡同步的復雜溝通

在大模型訓練過程中,將模型切分至單卡後,每次計算後單卡之間都需要進行對齊。在NCCL等通信原語中,All-to-All等操作較爲常見,這對網路傳輸和交換提出了更高要求。

1.3 昂貴的故障成本

大模型訓練往往持續數月,中斷後需回到斷點重新訓練。網路中任一環節的故障或高延遲都可能導致中斷,增加成本和延長進度。現代AI網路已發展成堪比飛機、航母等的復雜系統工程。

2. 網路創新的方向

經過兩年發展,全球算力投資規模已達數百億美元級別。模型參數持續擴張,巨頭間競爭依然激烈。當前,"降本"、"開放"和算力規模平衡成爲網路創新的主要議題。

2.1 通信介質的更迭

光、銅與硅是主要傳輸介質。AI時代,光模塊在追求更高速率同時,也通過LPO、LRO、硅光等方案降低成本。銅纜憑藉性價比和低故障率佔據機櫃內連接優勢。Chiplet、Wafer-scaling等新技術正在探索硅基互聯的上限。

2.2 網路協議的競爭

片間通信協議與顯卡強綁定,如NVLINK、Infinity Fabric等,決定了單節點算力上限,是巨頭間的激烈戰場。IB與以太網的競爭則是節點間通信的主旋律。

2.3 網路架構的變化

當前節點間網路普遍採用葉脊架構,具有便捷、簡單、穩定等優勢。但隨着單集羣節點數增多,葉脊架構在超大集羣中顯得冗餘,帶來較大網路成本。Dragonfly架構、rail-only架構等新方案有望成爲面向下一代超大集羣的演進方向。

3. 投資建議

通信系統核心環節:中際旭創、新易盛、天孚通信、滬電股份。

通信系統創新環節:長飛光纖、中天科技、亨通光電、盛科通信。

4. 風險提示

  1. AI需求不及預期
  2. Scaling law失效
  3. 行業競爭加劇
ETH-2.97%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 5
  • 分享
留言
0/400
Layer2观察员vip
· 8小時前
别扯了 显卡厂商在暗中狂喜
回復0
链上资深福尔摩斯vip
· 11小時前
公链上随便混混吧 被割被教育也习惯了
回復0
币圈鸡汤哥vip
· 11小時前
搞机会啦兄弟们!
回復0
社区混子王vip
· 11小時前
炒来炒去 还是炒网络
回復0
ShadowStakervip
· 11小時前
唉... 网络拓扑还没有准备好承载这个人工智能的负载,老实说
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)