من خلال مسار بيانات الذكاء الاصطناعي، نرى إمكانات تطوير DataFi
إن العالم اليوم في عصر يتسابق فيه الجميع لبناء أفضل النماذج الأساسية على مستوى العالم. على الرغم من أن القدرة الحاسوبية وبنية النماذج مهمتان، إلا أن السور الحقيقي هو بيانات التدريب. ستتناول هذه المقالة Scale AI، وستستكشف إمكانيات حلبة بيانات الذكاء الاصطناعي.
طريق نجاح Scale AI
تُقدّر قيمة Scale AI حاليا بـ 29 مليار دولار، وتشمل عملاءها الجيش الأمريكي والعديد من عمالقة الذكاء الاصطناعي الذين يتنافسون معها. الأعمال الأساسية لشركة Scale AI هي تقديم كميات كبيرة من البيانات المعلمة بدقة، وسبب تميزها بين العديد من الشركات الناشئة هو اكتشافها المبكر لأهمية البيانات في صناعة الذكاء الاصطناعي.
تعتبر قوة الحوسبة والنماذج والبيانات من الأعمدة الثلاثة الرئيسية لنماذج الذكاء الاصطناعي. خلال التطور السريع للنماذج اللغوية الكبيرة، شهدت الصناعة تحولًا في تركيزها من النماذج إلى قوة الحوسبة. اليوم، أصبحت معظم النماذج تعتمد على إطار العمل transformer، كما قامت الشركات الكبرى بحل مشكلة الحوسبة إما من خلال بناء تجمعات حوسبة فائقة خاص بها أو من خلال توقيع اتفاقيات طويلة الأمد مع مقدمي خدمات السحابة. في هذا السياق، تبرز أهمية البيانات بشكل متزايد.
تسعى Scale AI ليس فقط لاستخراج البيانات الحالية، بل تتطلع أيضًا إلى أعمال توليد البيانات على المدى الطويل. من خلال تشكيل فريق تدريب AI يتكون من خبراء بشريين من مجالات مختلفة، توفر بيانات تدريب عالية الجودة لتدريب نماذج AI.
مرحلتان لتدريب نموذج الذكاء الاصطناعي
يتكون تدريب نموذج الذكاء الاصطناعي من جزئين: التدريب المسبق والتكيف.
تشبه مرحلة التدريب المسبق عملية تعلم الكلام لدى الأطفال البشر. نحتاج إلى إدخال كميات كبيرة من النصوص والمعلومات البرمجية المستخرجة من الإنترنت إلى نموذج الذكاء الاصطناعي، حتى يتمكن النموذج من اكتساب مهارات التواصل الأساسية من خلال التعلم الذاتي.
تشبه مرحلة التعديل الدقيق التعليم المدرسي، حيث يوجد صواب وخطأ وإجابات واتجاهات واضحة. من خلال بعض مجموعات البيانات المستهدفة التي تم إعدادها مسبقًا، يمكننا تدريب النموذج على اكتساب قدرات معينة.
لذلك، يتم تقسيم البيانات المطلوبة لتدريب الذكاء الاصطناعي إلى فئتين:
بيانات ضخمة لا تتطلب الكثير من المعالجة، وعادة ما تأتي من بيانات الزحف من منصات UGC الكبيرة، قواعد بيانات الأدبيات العامة، وقواعد بيانات الشركات الخاصة.
تحتاج البيانات المصممة بدقة والمختارة، مثل الكتب الدراسية المتخصصة، إلى تنظيف البيانات، والاختيار، ووضع العلامات، والتعليقات اليدوية وغيرها من الأعمال.
تشكل هاتان الفئتان من مجموعات البيانات جوهر مسار بيانات الذكاء الاصطناعي. مع تحسين قدرات النماذج، ستصبح مجموعات البيانات التدريبية الأكثر دقة وتخصصًا عوامل مؤثرة رئيسية في قدرة النموذج.
Web3 DataFi: الأرض المثالية لبيانات الذكاء الاصطناعي
بالمقارنة مع طرق معالجة البيانات التقليدية، تتمتع Web3 بميزة طبيعية في مجال بيانات الذكاء الاصطناعي، ومن هنا وُلد مفهوم DataFi الجديد. تتمثل مزايا Web3 DataFi بشكل رئيسي في الجوانب التالية:
تضمن العقود الذكية سيادة البيانات والأمان والخصوصية
ميزة التحكيم الجغرافي الناتجة عن الهيكل اللامركزي
المزايا الواضحة للتحفيز والتسوية في البلوكشين
يساعد في بناء سوق بيانات "شاملة" أكثر كفاءة وانفتاحًا.
بالنسبة للمستخدمين العاديين، فإن DataFi هو المشروع الأكثر سهولة للمشاركة في الذكاء الاصطناعي اللامركزي. لا يحتاج المستخدمون إلى توقيع عقود معقدة أو استثمار في أجهزة باهظة الثمن، بل يمكنهم المشاركة من خلال مهام بسيطة مثل تقديم البيانات، تقييم النماذج، واستخدام أدوات الذكاء الاصطناعي لإجراء إبداعات بسيطة.
مشاريع Web3 DataFi ذات الإمكانيات
في الوقت الحالي، حصلت العديد من مشاريع Web3 DataFi على تمويلات كبيرة، مما يظهر الإمكانات الكبيرة في هذا المجال. فيما يلي بعض المشاريع التمثيلية:
يوب: منصة ردود الفعل لنماذج الذكاء الاصطناعي، تجمع تعليقات المستخدمين على محتوى ناتج النماذج.
فانا: تحويل البيانات الشخصية للمستخدمين إلى أصول رقمية قابلة للتداول.
Chainbase: تركز على بيانات السلسلة، تغطي أكثر من 200 سلسلة كتل.
Sapien: يهدف إلى تحويل المعرفة البشرية على نطاق واسع إلى بيانات تدريب عالية الجودة للذكاء الاصطناعي.
Prisma X: يهدف إلى أن يكون طبقة التنسيق المفتوحة للروبوتات، وجمع البيانات الفيزيائية هو المفتاح لذلك.
Masa: المشروع الرائد في شبكة Bittensor البيئية، يدير شبكة بيانات الشبكة وشبكة الوكيل.
Irys: تركز على تخزين البيانات القابل للبرمجة والحساب.
ORO: تمكين الأشخاص العاديين من المشاركة في مساهمات الذكاء الاصطناعي.
Gata: تحديد كطبقة بيانات لامركزية، توفر طرق متعددة للمشاركة.
التفكير في المشروع الحالي
حاليًا، فإن حواجز الدخول لهذه المشاريع عمومًا ليست مرتفعة، ولكن بمجرد تراكم المستخدمين والالتصاق بالبيئة، ستتراكم مزايا المنصة بسرعة. لذلك، يجب على المشاريع المبكرة أن تركز بشكل كبير على الحوافز وتجربة المستخدم.
في الوقت نفسه، تحتاج هذه المنصات البيانية إلى مراعاة كيفية إدارة العمالة وضمان جودة إنتاج البيانات، وتجنب ظاهرة طرد العملة الجيدة من قبل العملة الرديئة. وقد بدأت مشاريع مثل Sahara و Sapien في تعزيز إدارة جودة البيانات.
بالإضافة إلى ذلك، فإن زيادة الشفافية تعتبر أيضًا مشكلة مهمة تواجه المشاريع على السلسلة في الوقت الحالي. لا تزال العديد من المشاريع تفتقر إلى بيانات كافية ومفتوحة وقابلة للتتبع، مما يؤثر سلبًا على التنمية الصحية الطويلة الأجل لـ Web3 DataFi.
في النهاية، يتطلب التطبيق الواسع النطاق لـ DataFi جذب عدد كافٍ من المشاركين الأفراد والحصول على اعتراف الشركات السائدة. وقد حققت بعض المشاريع مثل Sahara AI و Vana تقدمًا جيدًا في هذا الصدد.
تمثل DataFi علاقة التعايش طويلة الأمد بين الذكاء البشري والذكاء الآلي. بالنسبة لأولئك الذين يتطلعون إلى عصر الذكاء الاصطناعي ويشعرون بالقلق في نفس الوقت، فإن المشاركة في DataFi تعتبر خيارًا جيدًا يتماشى مع الاتجاه.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 14
أعجبني
14
4
مشاركة
تعليق
0/400
ReverseFOMOguy
· منذ 5 س
بدأوا يتحدثون عن DataFi مرة أخرى
شاهد النسخة الأصليةرد0
CryptoCross-TalkClub
· منذ 5 س
آها، أخيرًا بدأوا في خداع الناس لتحقيق الربح من AI الحمقى، المرة الماضية كانت عن Metaverse، وهذه المرة تأتي قصة جديدة
DataFi: الفرص الجديدة في عصر الذكاء الاصطناعي كيف يقود Web3 مسار البيانات
من خلال مسار بيانات الذكاء الاصطناعي، نرى إمكانات تطوير DataFi
إن العالم اليوم في عصر يتسابق فيه الجميع لبناء أفضل النماذج الأساسية على مستوى العالم. على الرغم من أن القدرة الحاسوبية وبنية النماذج مهمتان، إلا أن السور الحقيقي هو بيانات التدريب. ستتناول هذه المقالة Scale AI، وستستكشف إمكانيات حلبة بيانات الذكاء الاصطناعي.
طريق نجاح Scale AI
تُقدّر قيمة Scale AI حاليا بـ 29 مليار دولار، وتشمل عملاءها الجيش الأمريكي والعديد من عمالقة الذكاء الاصطناعي الذين يتنافسون معها. الأعمال الأساسية لشركة Scale AI هي تقديم كميات كبيرة من البيانات المعلمة بدقة، وسبب تميزها بين العديد من الشركات الناشئة هو اكتشافها المبكر لأهمية البيانات في صناعة الذكاء الاصطناعي.
تعتبر قوة الحوسبة والنماذج والبيانات من الأعمدة الثلاثة الرئيسية لنماذج الذكاء الاصطناعي. خلال التطور السريع للنماذج اللغوية الكبيرة، شهدت الصناعة تحولًا في تركيزها من النماذج إلى قوة الحوسبة. اليوم، أصبحت معظم النماذج تعتمد على إطار العمل transformer، كما قامت الشركات الكبرى بحل مشكلة الحوسبة إما من خلال بناء تجمعات حوسبة فائقة خاص بها أو من خلال توقيع اتفاقيات طويلة الأمد مع مقدمي خدمات السحابة. في هذا السياق، تبرز أهمية البيانات بشكل متزايد.
تسعى Scale AI ليس فقط لاستخراج البيانات الحالية، بل تتطلع أيضًا إلى أعمال توليد البيانات على المدى الطويل. من خلال تشكيل فريق تدريب AI يتكون من خبراء بشريين من مجالات مختلفة، توفر بيانات تدريب عالية الجودة لتدريب نماذج AI.
مرحلتان لتدريب نموذج الذكاء الاصطناعي
يتكون تدريب نموذج الذكاء الاصطناعي من جزئين: التدريب المسبق والتكيف.
تشبه مرحلة التدريب المسبق عملية تعلم الكلام لدى الأطفال البشر. نحتاج إلى إدخال كميات كبيرة من النصوص والمعلومات البرمجية المستخرجة من الإنترنت إلى نموذج الذكاء الاصطناعي، حتى يتمكن النموذج من اكتساب مهارات التواصل الأساسية من خلال التعلم الذاتي.
تشبه مرحلة التعديل الدقيق التعليم المدرسي، حيث يوجد صواب وخطأ وإجابات واتجاهات واضحة. من خلال بعض مجموعات البيانات المستهدفة التي تم إعدادها مسبقًا، يمكننا تدريب النموذج على اكتساب قدرات معينة.
لذلك، يتم تقسيم البيانات المطلوبة لتدريب الذكاء الاصطناعي إلى فئتين:
بيانات ضخمة لا تتطلب الكثير من المعالجة، وعادة ما تأتي من بيانات الزحف من منصات UGC الكبيرة، قواعد بيانات الأدبيات العامة، وقواعد بيانات الشركات الخاصة.
تحتاج البيانات المصممة بدقة والمختارة، مثل الكتب الدراسية المتخصصة، إلى تنظيف البيانات، والاختيار، ووضع العلامات، والتعليقات اليدوية وغيرها من الأعمال.
تشكل هاتان الفئتان من مجموعات البيانات جوهر مسار بيانات الذكاء الاصطناعي. مع تحسين قدرات النماذج، ستصبح مجموعات البيانات التدريبية الأكثر دقة وتخصصًا عوامل مؤثرة رئيسية في قدرة النموذج.
Web3 DataFi: الأرض المثالية لبيانات الذكاء الاصطناعي
بالمقارنة مع طرق معالجة البيانات التقليدية، تتمتع Web3 بميزة طبيعية في مجال بيانات الذكاء الاصطناعي، ومن هنا وُلد مفهوم DataFi الجديد. تتمثل مزايا Web3 DataFi بشكل رئيسي في الجوانب التالية:
بالنسبة للمستخدمين العاديين، فإن DataFi هو المشروع الأكثر سهولة للمشاركة في الذكاء الاصطناعي اللامركزي. لا يحتاج المستخدمون إلى توقيع عقود معقدة أو استثمار في أجهزة باهظة الثمن، بل يمكنهم المشاركة من خلال مهام بسيطة مثل تقديم البيانات، تقييم النماذج، واستخدام أدوات الذكاء الاصطناعي لإجراء إبداعات بسيطة.
مشاريع Web3 DataFi ذات الإمكانيات
في الوقت الحالي، حصلت العديد من مشاريع Web3 DataFi على تمويلات كبيرة، مما يظهر الإمكانات الكبيرة في هذا المجال. فيما يلي بعض المشاريع التمثيلية:
Sahara AI: تسعى لبناء بنية تحتية فائقة لذكاء اصطناعي لامركزي وسوق تداول.
يوب: منصة ردود الفعل لنماذج الذكاء الاصطناعي، تجمع تعليقات المستخدمين على محتوى ناتج النماذج.
فانا: تحويل البيانات الشخصية للمستخدمين إلى أصول رقمية قابلة للتداول.
Chainbase: تركز على بيانات السلسلة، تغطي أكثر من 200 سلسلة كتل.
Sapien: يهدف إلى تحويل المعرفة البشرية على نطاق واسع إلى بيانات تدريب عالية الجودة للذكاء الاصطناعي.
Prisma X: يهدف إلى أن يكون طبقة التنسيق المفتوحة للروبوتات، وجمع البيانات الفيزيائية هو المفتاح لذلك.
Masa: المشروع الرائد في شبكة Bittensor البيئية، يدير شبكة بيانات الشبكة وشبكة الوكيل.
Irys: تركز على تخزين البيانات القابل للبرمجة والحساب.
ORO: تمكين الأشخاص العاديين من المشاركة في مساهمات الذكاء الاصطناعي.
Gata: تحديد كطبقة بيانات لامركزية، توفر طرق متعددة للمشاركة.
التفكير في المشروع الحالي
حاليًا، فإن حواجز الدخول لهذه المشاريع عمومًا ليست مرتفعة، ولكن بمجرد تراكم المستخدمين والالتصاق بالبيئة، ستتراكم مزايا المنصة بسرعة. لذلك، يجب على المشاريع المبكرة أن تركز بشكل كبير على الحوافز وتجربة المستخدم.
في الوقت نفسه، تحتاج هذه المنصات البيانية إلى مراعاة كيفية إدارة العمالة وضمان جودة إنتاج البيانات، وتجنب ظاهرة طرد العملة الجيدة من قبل العملة الرديئة. وقد بدأت مشاريع مثل Sahara و Sapien في تعزيز إدارة جودة البيانات.
بالإضافة إلى ذلك، فإن زيادة الشفافية تعتبر أيضًا مشكلة مهمة تواجه المشاريع على السلسلة في الوقت الحالي. لا تزال العديد من المشاريع تفتقر إلى بيانات كافية ومفتوحة وقابلة للتتبع، مما يؤثر سلبًا على التنمية الصحية الطويلة الأجل لـ Web3 DataFi.
في النهاية، يتطلب التطبيق الواسع النطاق لـ DataFi جذب عدد كافٍ من المشاركين الأفراد والحصول على اعتراف الشركات السائدة. وقد حققت بعض المشاريع مثل Sahara AI و Vana تقدمًا جيدًا في هذا الصدد.
تمثل DataFi علاقة التعايش طويلة الأمد بين الذكاء البشري والذكاء الآلي. بالنسبة لأولئك الذين يتطلعون إلى عصر الذكاء الاصطناعي ويشعرون بالقلق في نفس الوقت، فإن المشاركة في DataFi تعتبر خيارًا جيدًا يتماشى مع الاتجاه.