Jaringan di Era AI: Sumber Permintaan dan Arah Inovasi
Jaringan memainkan peran kunci di era model AI besar. Dengan cepatnya pertumbuhan skala model besar, perangkat jaringan seperti modul optik, saklar, dan lainnya mengalami ledakan permintaan dan percepatan iterasi. Artikel ini akan membahas dari prinsipnya, mengapa jaringan menjadi fokus baru di era AI, dan mendiskusikan inovasi dan peluang investasi di sisi jaringan dalam perubahan industri.
1. Sumber Permintaan Jaringan
Masuk ke era model besar, perbedaan antara skala model dan batas maksimum kartu tunggal dengan cepat meluas, kluster beberapa server menjadi pilihan yang diperlukan untuk melatih model, ini membentuk dasar peningkatan pentingnya jaringan di era AI. Berbeda dengan masa lalu yang hanya digunakan untuk transfer data, jaringan sekarang lebih banyak digunakan untuk menyinkronkan parameter model antar kartu grafis, yang menuntut kepadatan dan kapasitas jaringan yang lebih tinggi.
1.1 Skala model yang semakin besar
Waktu pelatihan = Ukuran data pelatihan × Jumlah parameter model / Kecepatan komputasi
Kecepatan perhitungan = Kecepatan perhitungan per perangkat × Jumlah perangkat × Efisiensi paralel banyak perangkat
Dalam mengejar skala data pelatihan dan parameter secara bersamaan, hanya dengan mempercepat peningkatan efisiensi komputasi, kita dapat memperpendek waktu pelatihan. Peningkatan kecepatan komputasi pada perangkat tunggal memiliki siklus dan batasan, oleh karena itu cara untuk memanfaatkan jaringan untuk memperluas "jumlah perangkat" dan "efisiensi paralel" secara langsung menentukan tingkat daya komputasi.
1.2 Komunikasi kompleks untuk sinkronisasi multi-kartu
Dalam proses pelatihan model besar, setelah model dibagi menjadi satu kartu, setiap kali perhitungan dilakukan, perlu ada penyelarasan antara kartu tunggal. Dalam primitif komunikasi seperti NCCL, operasi All-to-All cukup umum, yang menuntut persyaratan lebih tinggi untuk transmisi dan pertukaran jaringan.
1.3 Biaya kesalahan yang mahal
Pelatihan model besar seringkali berlangsung selama berbulan-bulan, dan setelah terputus, perlu kembali ke titik henti untuk melanjutkan pelatihan. Gangguan atau latensi tinggi di mana saja dalam jaringan dapat menyebabkan terputusnya pelatihan, meningkatkan biaya dan memperpanjang jadwal. Jaringan AI modern telah berkembang menjadi rekayasa sistem yang kompleks, setara dengan pesawat terbang, kapal induk, dan sebagainya.
2. Arah Inovasi Jaringan
Setelah dua tahun perkembangan, skala investasi kekuatan komputasi global telah mencapai ratusan miliar dolar. Parameter model terus berkembang, persaingan antar raksasa tetap ketat. Saat ini, "pengurangan biaya", "keterbukaan" dan keseimbangan skala kekuatan komputasi menjadi isu utama dalam inovasi jaringan.
2.1 Perubahan Media Komunikasi
Cahaya, tembaga, dan silikon adalah media transmisi utama. Di era AI, modul cahaya tidak hanya mengejar kecepatan yang lebih tinggi, tetapi juga mengurangi biaya melalui solusi seperti LPO, LRO, dan silikon optik. Kabel tembaga menduduki keunggulan koneksi di dalam rak karena rasio biaya-ke-kinerja dan tingkat kegagalan yang rendah. Teknologi baru seperti Chiplet dan Wafer-scaling sedang mengeksplorasi batasan interkoneksi berbasis silikon.
2.2 Persaingan Protokol Jaringan
Protokol komunikasi antar chip yang kuat terikat dengan kartu grafis, seperti NVLINK, Infinity Fabric, dll., menentukan batas atas kekuatan komputasi satu node, merupakan medan pertempuran yang sengit antara raksasa. Persaingan antara IB dan Ethernet adalah lagu utama komunikasi antar node.
2.3 Perubahan Arsitektur Jaringan
Arsitektur leaf-spine umumnya diadopsi di antara node saat ini, memiliki keuntungan seperti kemudahan, kesederhanaan, dan stabilitas. Namun, seiring dengan bertambahnya jumlah node dalam satu cluster, arsitektur leaf-spine menjadi redundan dalam cluster super besar, yang membawa biaya jaringan yang cukup besar. Arsitektur Dragonfly, arsitektur rail-only, dan solusi baru lainnya diharapkan menjadi arah evolusi untuk cluster super besar generasi berikutnya.
3. Saran Investasi
Bagian inti sistem komunikasi: Zhongji Xuchuang, Xinyi Sheng, Tianfu Communication, Hu Dian Co., Ltd.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
12 Suka
Hadiah
12
5
Bagikan
Komentar
0/400
Layer2Observer
· 15jam yang lalu
Jangan bicara omong kosong, produsen kartu grafis diam-diam bersuka cita.
Lihat AsliBalas0
OnchainDetective
· 17jam yang lalu
Bersenang-senang di rantai publik, sudah terbiasa dipermainkan dan diajari.
Lihat AsliBalas0
CryptoMotivator
· 17jam yang lalu
Ayo, saudara-saudara! Selesaikan peluang ini!
Lihat AsliBalas0
CommunitySlacker
· 17jam yang lalu
Dimasak dan dimasak lagi, tetap saja memasak jaringan
Lihat AsliBalas0
ShadowStaker
· 18jam yang lalu
meh... topologi jaringan tidak siap untuk beban ai ini sejujurnya
Ledakan permintaan jaringan di era AI Mencari inovasi industri dan peluang investasi
Jaringan di Era AI: Sumber Permintaan dan Arah Inovasi
Jaringan memainkan peran kunci di era model AI besar. Dengan cepatnya pertumbuhan skala model besar, perangkat jaringan seperti modul optik, saklar, dan lainnya mengalami ledakan permintaan dan percepatan iterasi. Artikel ini akan membahas dari prinsipnya, mengapa jaringan menjadi fokus baru di era AI, dan mendiskusikan inovasi dan peluang investasi di sisi jaringan dalam perubahan industri.
1. Sumber Permintaan Jaringan
Masuk ke era model besar, perbedaan antara skala model dan batas maksimum kartu tunggal dengan cepat meluas, kluster beberapa server menjadi pilihan yang diperlukan untuk melatih model, ini membentuk dasar peningkatan pentingnya jaringan di era AI. Berbeda dengan masa lalu yang hanya digunakan untuk transfer data, jaringan sekarang lebih banyak digunakan untuk menyinkronkan parameter model antar kartu grafis, yang menuntut kepadatan dan kapasitas jaringan yang lebih tinggi.
1.1 Skala model yang semakin besar
Waktu pelatihan = Ukuran data pelatihan × Jumlah parameter model / Kecepatan komputasi Kecepatan perhitungan = Kecepatan perhitungan per perangkat × Jumlah perangkat × Efisiensi paralel banyak perangkat
Dalam mengejar skala data pelatihan dan parameter secara bersamaan, hanya dengan mempercepat peningkatan efisiensi komputasi, kita dapat memperpendek waktu pelatihan. Peningkatan kecepatan komputasi pada perangkat tunggal memiliki siklus dan batasan, oleh karena itu cara untuk memanfaatkan jaringan untuk memperluas "jumlah perangkat" dan "efisiensi paralel" secara langsung menentukan tingkat daya komputasi.
1.2 Komunikasi kompleks untuk sinkronisasi multi-kartu
Dalam proses pelatihan model besar, setelah model dibagi menjadi satu kartu, setiap kali perhitungan dilakukan, perlu ada penyelarasan antara kartu tunggal. Dalam primitif komunikasi seperti NCCL, operasi All-to-All cukup umum, yang menuntut persyaratan lebih tinggi untuk transmisi dan pertukaran jaringan.
1.3 Biaya kesalahan yang mahal
Pelatihan model besar seringkali berlangsung selama berbulan-bulan, dan setelah terputus, perlu kembali ke titik henti untuk melanjutkan pelatihan. Gangguan atau latensi tinggi di mana saja dalam jaringan dapat menyebabkan terputusnya pelatihan, meningkatkan biaya dan memperpanjang jadwal. Jaringan AI modern telah berkembang menjadi rekayasa sistem yang kompleks, setara dengan pesawat terbang, kapal induk, dan sebagainya.
2. Arah Inovasi Jaringan
Setelah dua tahun perkembangan, skala investasi kekuatan komputasi global telah mencapai ratusan miliar dolar. Parameter model terus berkembang, persaingan antar raksasa tetap ketat. Saat ini, "pengurangan biaya", "keterbukaan" dan keseimbangan skala kekuatan komputasi menjadi isu utama dalam inovasi jaringan.
2.1 Perubahan Media Komunikasi
Cahaya, tembaga, dan silikon adalah media transmisi utama. Di era AI, modul cahaya tidak hanya mengejar kecepatan yang lebih tinggi, tetapi juga mengurangi biaya melalui solusi seperti LPO, LRO, dan silikon optik. Kabel tembaga menduduki keunggulan koneksi di dalam rak karena rasio biaya-ke-kinerja dan tingkat kegagalan yang rendah. Teknologi baru seperti Chiplet dan Wafer-scaling sedang mengeksplorasi batasan interkoneksi berbasis silikon.
2.2 Persaingan Protokol Jaringan
Protokol komunikasi antar chip yang kuat terikat dengan kartu grafis, seperti NVLINK, Infinity Fabric, dll., menentukan batas atas kekuatan komputasi satu node, merupakan medan pertempuran yang sengit antara raksasa. Persaingan antara IB dan Ethernet adalah lagu utama komunikasi antar node.
2.3 Perubahan Arsitektur Jaringan
Arsitektur leaf-spine umumnya diadopsi di antara node saat ini, memiliki keuntungan seperti kemudahan, kesederhanaan, dan stabilitas. Namun, seiring dengan bertambahnya jumlah node dalam satu cluster, arsitektur leaf-spine menjadi redundan dalam cluster super besar, yang membawa biaya jaringan yang cukup besar. Arsitektur Dragonfly, arsitektur rail-only, dan solusi baru lainnya diharapkan menjadi arah evolusi untuk cluster super besar generasi berikutnya.
3. Saran Investasi
Bagian inti sistem komunikasi: Zhongji Xuchuang, Xinyi Sheng, Tianfu Communication, Hu Dian Co., Ltd.
Inovasi sistem komunikasi: Yangtze Optical Fiber, Zhongtian Technology, Hengtong Optic-Electric, Shengke Communication.
4. Peringatan Risiko