📢 #Gate广场征文活动第三期# 正式啓動!
🎮 本期聚焦:Yooldo Games (ESPORTS)
✍️ 分享獨特見解 + 參與互動推廣,若同步參與 Gate 第 286 期 Launchpool、CandyDrop 或 Alpha 活動,即可獲得任意獎勵資格!
💡 內容創作 + 空投參與 = 雙重加分,大獎候選人就是你!
💰總獎池:4,464 枚 $ESPORTS
🏆 一等獎(1名):964 枚
🥈 二等獎(5名):每人 400 枚
🥉 三等獎(10名):每人 150 枚
🚀 參與方式:
在 Gate廣場發布不少於 300 字的原創文章
添加標籤: #Gate广场征文活动第三期#
每篇文章需 ≥3 個互動(點讚 / 評論 / 轉發)
發布參與 Launchpool / CandyDrop / Alpha 任一活動的截圖,作爲獲獎資格憑證
同步轉發至 X(推特)可增加獲獎概率,標籤:#GateSquare 👉 https://www.gate.com/questionnaire/6907
🎯 雙倍獎勵機會:參與第 286 期 Launchpool!
質押 BTC 或 ESPORTS,瓜分 803,571 枚 $ESPORTS,每小時發放
時間:7 月 21 日 20:00 – 7 月 25 日 20:00(UTC+8)
🧠 寫作方向建議:
Yooldo
AI時代網路需求爆發 探尋行業創新與投資機遇
AI時代的網路:需求源頭與創新方向
網路在AI大模型時代扮演着關鍵角色。隨着大模型規模的快速增長,網路設備如光模塊、交換機等迎來需求爆發和迭代加速。本文將從原理出發,探討網路爲何成爲AI時代的新焦點,並討論產業變化中網路側的創新與投資機會。
1. 網路需求的來源
進入大模型時代,模型規模與單卡上限差距迅速擴大,多服務器集羣成爲解決模型訓練的必然選擇,這構成了AI時代網路重要性提升的基礎。與過去單純用於數據傳輸不同,網路現在更多用於同步顯卡間的模型參數,對網路密度和容量提出了更高要求。
1.1 日益龐大的模型規模
訓練耗時 = 訓練數據規模 × 模型參數量 / 計算速率 計算速率 = 單設備計算速率 × 設備數 × 多設備並行效率
在對訓練數據規模和參數的雙重追求下,只有加速提升計算效率,才能縮短訓練耗時。單設備計算速率的提升存在週期和限制,因此如何利用網路擴大"設備數"和"並行效率"直接決定了算力水平。
1.2 多卡同步的復雜溝通
在大模型訓練過程中,將模型切分至單卡後,每次計算後單卡之間都需要進行對齊。在NCCL等通信原語中,All-to-All等操作較爲常見,這對網路傳輸和交換提出了更高要求。
1.3 昂貴的故障成本
大模型訓練往往持續數月,中斷後需回到斷點重新訓練。網路中任一環節的故障或高延遲都可能導致中斷,增加成本和延長進度。現代AI網路已發展成堪比飛機、航母等的復雜系統工程。
2. 網路創新的方向
經過兩年發展,全球算力投資規模已達數百億美元級別。模型參數持續擴張,巨頭間競爭依然激烈。當前,"降本"、"開放"和算力規模平衡成爲網路創新的主要議題。
2.1 通信介質的更迭
光、銅與硅是主要傳輸介質。AI時代,光模塊在追求更高速率同時,也通過LPO、LRO、硅光等方案降低成本。銅纜憑藉性價比和低故障率佔據機櫃內連接優勢。Chiplet、Wafer-scaling等新技術正在探索硅基互聯的上限。
2.2 網路協議的競爭
片間通信協議與顯卡強綁定,如NVLINK、Infinity Fabric等,決定了單節點算力上限,是巨頭間的激烈戰場。IB與以太網的競爭則是節點間通信的主旋律。
2.3 網路架構的變化
當前節點間網路普遍採用葉脊架構,具有便捷、簡單、穩定等優勢。但隨着單集羣節點數增多,葉脊架構在超大集羣中顯得冗餘,帶來較大網路成本。Dragonfly架構、rail-only架構等新方案有望成爲面向下一代超大集羣的演進方向。
3. 投資建議
通信系統核心環節:中際旭創、新易盛、天孚通信、滬電股份。
通信系統創新環節:長飛光纖、中天科技、亨通光電、盛科通信。
4. 風險提示