ت突破 تكنولوجيا إنشاء الفيديو بالذكاء الاصطناعي، تواجه Web3 AI فرصًا جديدة

حققت تقنية توليد الفيديو بالذكاء الاصطناعي تقدمًا كبيرًا، مما يفتح آفاقًا جديدة للذكاء الاصطناعي في Web3

أحد التغييرات الأكثر بروزًا في مجال الذكاء الاصطناعي مؤخرًا هو突破 تقنية生成 الفيديو متعدد النمط. لقد تطورت هذه التقنية من إنشاء الفيديو من نصوص فقط إلى نموذج إنشاء شامل يدمج النصوص والصور والصوت.

تشمل بعض حالات الاختراق التكنولوجي التي تستحق الانتباه:

  1. إطار EX-4D المفتوح المصدر من شركة تكنولوجيا يمكنه تحويل الفيديو أحادي العين إلى محتوى 4D بزاوية رؤية حرة، حيث تتجاوز نسبة رضا المستخدمين 70%. وهذا يعني أن الذكاء الاصطناعي يمكنه تلقائيًا إنشاء تأثيرات مشاهدة من زوايا مختلفة للفيديو العادي، وهو ما كان يتطلب في السابق فريق نمذجة ثلاثية الأبعاد محترف.

  2. أعلنت منصة AI معينة أنها قادرة على إنتاج فيديو بدقة "سينمائية" مدتها 10 ثوانٍ من صورة واحدة. لا يزال يتعين التحقق من التأثيرات المحددة بعد تحديث النسخة الاحترافية.

  3. تقنية تم تطويرها بواسطة مؤسسة بحثية معروفة في مجال الذكاء الاصطناعي قادرة على توليد فيديو بدقة 4K وصوت بيئي بشكل متزامن. تتغلب هذه التقنية على تحديات تزامن الصوت والصورة في المشاهد المعقدة، مثل تحقيق التطابق الدقيق بين حركة المشي في الصورة وصوت الخطوات.

  4. تستخدم نماذج الذكاء الاصطناعي في منصة الفيديو القصير 80 مليار معلمة، ويمكنها إنتاج فيديو بدقة 1080 بكسل في غضون 2.3 ثانية، بتكلفة حوالي 3.67 يوان/5 ثوانٍ. على الرغم من أن التحكم في التكاليف جيد، إلا أن هناك مجالاً لتحسين جودة الإنتاج في المشاهد المعقدة.

تمثل هذه الاختراقات أهمية كبيرة من حيث جودة الفيديو وتكاليف الإنتاج وسيناريوهات التطبيق:

من الناحية التقنية، فإن تعقيد إنشاء الفيديو متعدد الوسائط ينمو بشكل أسي. إنه يتطلب معالجة إنشاء صورة فردية (حوالي 10^6 نقطة بكسل)، وضمان تماسك التسلسل الزمني (على الأقل 100 إطار)، ومزامنة الصوت (10^4 نقطة عينة في الثانية) بالإضافة إلى اتساق الفضاء ثلاثي الأبعاد. في الوقت الحالي، يتم تحقيق هذه المهام المعقدة من خلال التفكيك المعياري والتعاون بين النماذج الكبيرة، حيث يركز كل نموذج على وظيفة محددة مثل تقدير العمق، وتحويل الزوايا، والتداخل الزمني، وتحسين الرندر وغيرها.

من حيث التكلفة، تلعب تحسينات الهيكل الاستدلالي دورًا حاسمًا. يشمل ذلك استراتيجيات التوليد المتدرجة (توليد الهيكل بدقة منخفضة أولاً، ثم تعزيز التفاصيل بدقة عالية)، وآلية إعادة استخدام التخزين المؤقت (إعادة استخدام المشاهد المماثلة) وتخصيص الموارد الديناميكي (تعديل عمق النموذج بناءً على تعقيد المحتوى).

في مجال التطبيقات، تكنولوجيا الذكاء الاصطناعي تقوم بإحداث ثورة في عمليات إنتاج الفيديو التقليدية. في الماضي، قد تتطلب مقاطع الفيديو الإعلانية التي تبلغ مدتها 30 ثانية تكاليف إنتاج تصل إلى عشرات الآلاف من اليوان، مع مراعاة المعدات، والمواقع، والممثلين، وما بعد الإنتاج. الآن، يمكن للذكاء الاصطناعي ضغط هذه العملية إلى بضع دقائق بعد إدخال كلمات الإرشاد، في حين أنه يمكن أيضًا تحقيق زوايا وتأثيرات خاصة يصعب الوصول إليها في التصوير التقليدي. ستعيد هذه الثورة تشكيل اقتصاد المبدعين، مما يجعل الإبداع والجمالية عوامل رئيسية.

تؤثر هذه التقدمات في تقنيات الذكاء الاصطناعي Web2 أيضًا بشكل مهم على مجال الذكاء الاصطناعي Web3:

  1. تغير هيكل الطلب على قوة الحوسبة خلق فرصاً لقوة الحوسبة الموزعة غير المستغلة، بينما زاد أيضاً من الطلب على نماذج الضبط الدقيق الموزعة المختلفة، والخوارزميات، ومنصات الاستدلال.

  2. زيادة طلبات التوصيف البياني توفر مشاهد تطبيق جديدة لآليات التحفيز في Web3. تتطلب إنشاء فيديو احترافي أوصاف مشهد دقيقة، وصور مرجعية، وأنماط صوتية، ومسارات حركة الكاميرا، وظروف إضاءة، وغيرها من البيانات المتخصصة. يمكن لأساليب التحفيز في Web3 تشجيع المصورين، ومهندسي الصوت، وفناني ثلاثي الأبعاد على تقديم مواد بيانات عالية الجودة.

  3. تطور تكنولوجيا الذكاء الاصطناعي من توزيع الموارد الكبيرة المركزية نحو التعاون المعياري، مما خلق طلبًا جديدًا على المنصات اللامركزية. في المستقبل، قد يؤدي دمج قوة الحوسبة والبيانات والنماذج وآليات التحفيز إلى تشكيل حلقة تعزيز ذاتية إيجابية، مما يعزز الاندماج العميق بين سيناريوهات Web3 AI وWeb2 AI.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • مشاركة
تعليق
0/400
rekt_but_not_brokevip
· 07-15 13:44
ما هو الغريب؟ إنه مجرد إضافة زائدة.
شاهد النسخة الأصليةرد0
DefiOldTrickstervip
· 07-15 06:02
لقد لعب العجوز بهذا لسنوات عديدة، ومن الواضح أن هذا الشيء يمكن أن يخدع الناس لتحقيق الربح، وداخل السلسلة سيثير جولة جديدة من big pump... آه، هل تذكرون تلك العملة الخاصة بالذكاء الاصطناعي التي تحدثت عنها في المرة الماضية؟
شاهد النسخة الأصليةرد0
ReverseTradingGuruvip
· 07-13 12:22
آه صحيح صحيح صحيح، يكفي أن يكون لديك يد، جميع الأعضاء أصبحوا من العاملين في مجال الذكاء الاصطناعي.
شاهد النسخة الأصليةرد0
WalletDetectivevip
· 07-13 12:21
بهذا المستوى؟ لا يفضل أن يكون مثل كاميرات المراقبة المبكرة
شاهد النسخة الأصليةرد0
GasOptimizervip
· 07-13 12:18
أقبل تعال! وفر الغاز في المسبح
شاهد النسخة الأصليةرد0
InfraVibesvip
· 07-13 12:13
هذا يتجاوز نطاق فهمي قليلاً 233
شاهد النسخة الأصليةرد0
DevChivevip
· 07-13 12:03
ثور الجلد، يبدو أن صناعة السينما في المستقبل ستفقد مجموعة من الوظائف
شاهد النسخة الأصليةرد0
  • تثبيت