Terobosan teknologi generasi video AI, Web3 AI menghadapi peluang baru

Teknologi Generasi Video AI Mencapai Kemajuan Terobosan, Membawa Peluang Baru untuk Web3 AI

Salah satu perubahan paling signifikan di bidang AI baru-baru ini adalah terobosan dalam teknologi generasi video multimodal. Teknologi ini telah berkembang dari generasi video berbasis teks murni menjadi model generasi jalur penuh yang mengintegrasikan teks, gambar, dan audio.

Beberapa contoh terobosan teknologi yang patut diperhatikan termasuk:

  1. Kerangka kerja EX-4D yang bersumber terbuka dari sebuah perusahaan teknologi dapat mengubah video monokuler menjadi konten 4D dengan sudut pandang bebas, dengan tingkat penerimaan pengguna lebih dari 70%. Ini berarti AI dapat secara otomatis menghasilkan efek tampilan dari sudut mana pun untuk video biasa, yang sebelumnya memerlukan tim pemodelan 3D profesional untuk menyelesaikannya.

  2. Sebuah platform AI mengklaim dapat menghasilkan video berkualitas "film" selama 10 detik dari satu gambar. Efek spesifiknya masih perlu diverifikasi setelah pembaruan versi profesionalnya.

  3. Teknologi yang dikembangkan oleh lembaga penelitian AI ternama dapat secara bersamaan menghasilkan video 4K dan suara lingkungan. Teknologi ini mengatasi tantangan sinkronisasi audio dan visual dalam skenario yang kompleks, seperti mencapai kesesuaian yang tepat antara gerakan berjalan di layar dan suara langkah.

  4. Model AI dari platform video pendek menggunakan 8 miliar parameter, dapat menghasilkan video 1080p dalam waktu 2,3 detik, dengan biaya sekitar 3,67 yuan/5 detik. Meskipun kontrol biaya cukup baik, masih ada ruang untuk perbaikan dalam kualitas generasi di skenario yang kompleks.

Terobosan ini memiliki arti penting dalam hal kualitas video, biaya produksi, dan skenario aplikasi:

Dalam aspek teknis, kompleksitas generasi video multimodal meningkat secara eksponensial. Ini membutuhkan pemrosesan generasi gambar tunggal (sekitar 10^6 titik piksel), memastikan konsistensi temporal (setidaknya 100 frame), sinkronisasi audio (10^4 titik sampel per detik), serta konsistensi ruang 3D. Saat ini, tugas kompleks ini dicapai melalui pemecahan modular dan kolaborasi model besar, di mana setiap modul fokus pada fungsi tertentu, seperti estimasi kedalaman, konversi sudut pandang, interpolasi temporal, dan optimasi rendering.

Dalam hal biaya, optimasi arsitektur inferensi memainkan peran kunci. Ini mencakup strategi generasi berlapis (menghasilkan kerangka pada resolusi rendah terlebih dahulu, kemudian meningkatkan detail pada resolusi tinggi), mekanisme penggunaan kembali cache (penggunaan kembali untuk adegan yang mirip), serta alokasi sumber daya dinamis (menyesuaikan kedalaman model sesuai dengan kompleksitas konten).

Dalam hal aplikasi, teknologi AI sedang mengubah proses produksi video tradisional. Dulu, sebuah iklan berdurasi 30 detik mungkin memerlukan biaya produksi ratusan ribu yuan, melibatkan peralatan, lokasi, aktor, dan pascaproduksi. Sekarang, AI dapat memperpendek proses ini menjadi beberapa menit setelah memasukkan kata kunci, sambil juga mencapai sudut pandang dan efek khusus yang sulit dicapai dengan pengambilan gambar tradisional. Perubahan ini akan membentuk kembali ekonomi kreator, menjadikan kreativitas dan estetika sebagai faktor kunci.

Kemajuan teknologi AI Web2 ini juga memiliki dampak penting pada bidang AI Web3:

  1. Perubahan struktur permintaan kekuatan komputasi menciptakan peluang bagi kekuatan komputasi terdistribusi yang tidak terpakai, sekaligus meningkatkan permintaan untuk berbagai model penyesuaian terdistribusi, algoritma, dan platform inferensi.

  2. Peningkatan kebutuhan penandaan data telah memberikan skenario aplikasi baru untuk mekanisme insentif Web3. Pembuatan video tingkat profesional memerlukan deskripsi adegan yang akurat, gambar referensi, gaya audio, jalur gerakan kamera, dan kondisi pencahayaan serta data profesional lainnya. Cara insentif Web3 dapat mendorong fotografer, desainer suara, dan seniman 3D untuk menyediakan materi data berkualitas tinggi.

  3. Evolusi teknologi AI dari alokasi sumber daya besar-besaran yang terpusat menuju kolaborasi modular telah menciptakan kebutuhan baru untuk platform terdesentralisasi. Di masa depan, kombinasi dari daya komputasi, data, model, dan mekanisme insentif dapat membentuk siklus positif yang memperkuat diri sendiri, mendorong integrasi mendalam antara skenario Web3 AI dan Web2 AI.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • Bagikan
Komentar
0/400
rekt_but_not_brokevip
· 07-15 13:44
Apa yang aneh, hanya menambahkan kaki pada ular.
Lihat AsliBalas0
DefiOldTrickstervip
· 07-15 06:02
Orang tua sudah bermain selama bertahun-tahun, barang ini jelas bisa memplay people for suckers, on-chain pasti akan memicu big pump lagi... Aduh, apakah kalian masih ingat tentang jebakan AI Token yang saya ceritakan sebelumnya?
Lihat AsliBalas0
ReverseTradingGuruvip
· 07-13 12:22
Ah iya iya iya, yang penting punya tangan, semua jadi pekerja AI.
Lihat AsliBalas0
WalletDetectivevip
· 07-13 12:21
Seperti ini? Lebih baik dari kamera pengawas awal.
Lihat AsliBalas0
GasOptimizervip
· 07-13 12:18
Ayo ayo! Hemat gas dari kolam besar!
Lihat AsliBalas0
InfraVibesvip
· 07-13 12:13
Sedikit di luar jangkauan pemahaman saya 233
Lihat AsliBalas0
DevChivevip
· 07-13 12:03
Bull market, masa depan industri perfilman mungkin akan kehilangan sejumlah pekerja.
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)