هل يمكن لـ DeepSeek أن تستمر في الازدهار؟

المؤلف: يو يان، صحفي في بنغبينغ نيوز

· قال مسؤول كبير في مجال نماذج البيانات الكبيرة لـ Pengpai Technology إن منطق توظيف DeepSeek ليس مختلفًا كثيرًا عن منطق توظيف الشركات الأخرى في مجال النماذج الكبيرة، حيث يكون العلامات الأساسية للمواهب "شابة وموهوبة"، أي الذين وُلدوا حوالي عام 1998، ومن الأفضل ألا تتجاوز خبرتهم العملية خمس سنوات، "ذكيون، علماء الرياضيات والعلوم، شباب، ذوي خبرة قليلة".

في وجهة نظر الخبراء في الصناعة ، يعتبر DeepSeek محظوظًا مقارنةً بالشركات الناشئة الأخرى في الصين ، فهو لا يواجه ضغوط التمويل ، ولا يحتاج إلى إثبات نفسه أمام المستثمرين ، ولا يحتاج إلى مواءمة تحسين التقنيات المتعلقة بالنماذج وتحسين تطبيق المنتجات. ومع ذلك ، كشركة تجارية ، فإنها ستواجه في نهاية المطاف ضغوطًا وتحديات مماثلة للشركات النموذجية الأخرى المستثمرة بكثافة في السوق.

أي شركة هي الأكثر شهرة في دائرة نماذج الحجم الكبير في الصين في عام 2024؟ بالتأكيد ستكون شركة Hangzhou DeepSeek للبحوث التقنية الأساسية للذكاء الاصطناعي (المعروفة بالاسم المختصر DeepSeek) منافساً قوياً. بعد أن شغلت DeepSeek دور البداية في حرب أسعار نماذج الحجم الكبير في منتصف العام الماضي ودخلت الى أذهان الجمهور، وبعد أن أطلقت توالياً نموذجها المفتوح المصدر DeepSeek-V3 ونموذج التفسير DeepSeek-R1 في بداية العام الجديد، أشعلت DeepSeek تماماً حماسة مجتمع نماذج الحجم الكبير. فإن الناس مذهولون من تكلفة التدريب الاقتصادية العالية لهذا النموذج (يقال إن التدريب على DeepSeek-V3 كلف فقط 557.6 مليون دولار أمريكي) ويصفقون لسلوكها في مشاركة النماذج المفتوحة المصدر وتقديم تقارير تقنية علنية. إصدار DeepSeek-R1 أثار حماسة العديد من العلماء والمطورين والمستخدمين، وبعضهم يرون في DeepSeek منافساً قوياً لأنماط التفكير البديلة مثل أوبن إيه آي.

لماذا يمكن لهذه الشركة الهادئة أن تنتج نماذج كبيرة الأداء بتكلفة تدريب منخفضة للغاية؟ ما الذي جعلها مشهورة اليوم؟ وما التحديات التي ستواجهها في المستقبل لمواصلة النجاح في عالم النماذج الكبيرة؟

الابتكار في الخوارزميات أدى إلى انخفاض كبير في تكلفة الطاقة الحسابية

"دبيسيك دخلت مبكرًا واكتسبت الكثير من التراكم ، ولها خصوصية في الخوارزمية." قالت إحدى كبار المديرين في شركة نجم نموذجية للنماذج الكبيرة في الصين عند الإشارة إلى ديبسيك ، إنها تعتقد أن السبب الرئيسي في نجاح ديبسيك هو الابتكار في الخوارزمية ، "وتعتقد أن الشركات الصينية بسبب نقص الطاقة الحسابية ، فإنها ستولي أكثر اهتمامًا لتوفير تكلفة الطاقة الحسابية من OpenAI".

وفقاً لمعلومات DeepSeek-R1 التي نشرتها DeepSeek ، فقد استخدمت تقنية التعلم التعزيزي بشكل كبير في مرحلة التدريب اللاحقة (Post-Training) ، وهو ما ساهم بشكل كبير في تحسين قدرة النموذج على التحليل بشكل كبير في المهام الرياضية والرمزية واللغوية الطبيعية ، وهو يضاهي الأداء الرسمي لـ OpenAI o1.

هل يمكن لديبسيك أن يستمر في النجاح؟

سعر واجهة برمجة التطبيقات DeepSeek-R1

أكد مؤسس DeepSeek ، ليانغ ونفينغ ، في السابق عدة مرات أن DeepSeek ملتزمة بفتح مسار تكنولوجي متميز بدلاً من استنساخ نموذج OpenAI ، ويجب على DeepSeek أن تجد طرقًا أكثر فعالية لتدريب نموذجها.

وقال خبير تقني يعمل في صناعة التكنولوجيا منذ سنوات إنهم استخدموا سلسلة من الحيل الهندسية لتحسين هيكل النموذج، مثل استخدام أساليب مختلطة للنموذج بشكل مبتكر، والهدف الأساسي هو تقليل التكلفة من خلال الهندسة لجعلها ربحية.

يمكن الاطلاع على المعلومات التي تم الكشف عنها بواسطة DeepSeek من خلال التقنيات المتعددة للانتباه والنماذج المختلطة للخبراء الخاصة بـ DeepSeekMOE(Mixture-of-Experts ، حققت تقدمًا كبيرًا في هذه الهياكل. يقوم هذان النوعان من التصميم التقني بتقليل موارد التدريب الحسابية ، مما يجعل نموذج DeepSeek أكثر فعالية من حيث التكلفة ويعزز كفاءة التدريب. وفقًا لبيانات معهد البحوث Epoch AI ، فإن نموذج DeepSeek الأحدث فعال للغاية.

من الناحية البيانية، بدلاً من إطعام OpenAI بكميات كبيرة من البيانات، يستخدم DeepSeek خوارزمية لتلخيص البيانات وتصنيفها، ثم يتم تقديمها للنماذج الكبيرة بعد المعالجة الانتقائية، مما يزيد من كفاءة التدريب ويقلل من تكلفة DeepSeek. بظهور DeepSeek-V3، تم تحقيق توازن بين الأداء العالي والتكلفة المنخفضة، وهو ما يوفر إمكانيات جديدة لتطوير النماذج الكبيرة.

"ربما لن يكون هناك حاجة في المستقبل إلى عنقود كبير من وحدات المعالجة المركزية GPU." قال المؤسس الأول لـ OpenAI Andrej Karpathy بعد إصدار نموذج عالي الكفاءة بسعر مناسب من DeepSeek.

أبداً

قال ديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind والمؤسس المشارك، إنه على الرغم من أنه ليس واضحا تماما حتى الآن إلى أي مدى يعتمد DeepSeek على بيانات التدريب والنماذج مفتوحة المصدر بالنسبة لأنظمة الغرب، يجب الاعتراف بأن الإنجازات التي حققها هذا الفريق حقا مذهلة. من ناحية، يعترف بأن لدى الصين قدرات هندسية وقدرة على التوسع ضخمة للغاية، ومن ناحية أخرى، يشير أيضا إلى أن الغرب لا يزال في المقدمة ويحتاج إلى التفكير في كيفية الحفاظ على موقع الريادة للنماذج الغربية.

التركيز على سنوات عديدة من التراكم السميك

السبب وراء قدرة DeepSeek على تحقيق هذه الابتكارات ليس عملًا يمتد على مدى يوم واحد ، بل هو نتيجة لسنوات من "التفكير" والتخطيط طويل الأجل. ليانغ ونفنغ هو أيضًا مؤسس هان فانغ كيوانت الكمية ، والتي تعتبر Deepseek أنها استفادت بشكل كامل من الأموال والبيانات والخبرة التي تم تراكمها في هان فانغ كيوانت.

تخرج Liang Wenfeng من جامعة Zhejiang بدرجة البكالوريوس ودرجة الماجستير في المعلومات والهندسة الإلكترونية. منذ عام 2008 ، قاد فريقا لاستكشاف التداول الكمي المؤتمت بالكامل باستخدام التعلم الآلي والتقنيات الأخرى. في عام 2015 ، تم إنشاء High-Flyer Quant ، وتم إطلاق أول نموذج الذكاء الاصطناعي في العام التالي ، وتم تنفيذ أول مركز تداول تم إنشاؤه بواسطة التعلم العميق ، وفي عام 2018 ، تم إنشاء الذكاء الاصطناعي كاتجاه التطوير الرئيسي. في عام 2020 ، تم تشغيل الكمبيوتر العملاق الذكاء الاصطناعي لشركة High-Flyer "Firefly No. 1" ، باستثمار تراكمي يزيد عن 100 مليون يوان ومساحة تعادل ملعب كرة السلة ، رسميا ، مدعيا أنه يمكن مقارنته بقوة الحوسبة الفائقة ل 40000 جهاز كمبيوتر شخصي. في عام 2021 ، استثمرت High-Flyer مليار يوان لبناء "Firefly No. 2" ، والتي تم تجهيزها ب 10000 شريحة A100GPU. في ذلك الوقت ، لم يكن هناك أكثر من 5 شركات لديها أكثر من 10000 وحدة معالجة رسومات في الصين ، وباستثناء High-Flyer Quant ، كانت جميع الشركات ال 4 الأخرى عمالقة الإنترنت.

في يوليو 2023 ، تأسست DeepSeek رسميًا ودخلت مجال الذكاء الاصطناعي العام ، ولم تتلقَ تمويلًا خارجيًا حتى الآن.

“هناك بطاقة نسبية من البرامجة، ولا ضغط تمويل، فقد قامت الشركات الكبيرة في البلاد بعد العامين الأولين فقط على الموديل دون إنتاج، مما دفع ديبسيك وغيرها من شركات البلاد الكبيرة أن تبدو أكثر المجاملة، والتركيز، والقدرة على التقدم في المهندسين المدنيين والخوالي؄اللاسيمات.

وبالإضافة إلى ذلك، وفي ظل تزايد عزلة صناعة النماذج الكبيرة، فإن سلوك DeepSeek لإصدار نموذجها مفتوح المصدر وتقديم تقرير تقني عام يتمتع بتقدير كبير من قبل المطورين، مما جعل علامتها التجارية تتميز بسرعة في سوق النماذج الكبيرة في الداخل والخارج.

قال باحثون لـ Pengpai Technology إن الطابع المفتوح لـ DeepSeek مذهل للغاية، وقد رفعت موديلات V3 و R1 المفتوحة مستوى الأساس في السوق.

نجاح يثبت قوة الشباب

نجاح DeekSeek أيضًا يظهر للجميع قوة الشباب، بشكل أساسي، تطوير الذكاء الاصطناعي لهذا الجيل يحتاج إلى عقول شابة.

من قبل، قال جاك كلارك، السياسي السابق لدى OpenAI وشريك مؤسس في Anthropic، إن DeepSeek استخدمت "مجموعة من العباقرة الغامضين والعميقين". بالنسبة لهذا، قال ليانغ ونفينغ في مقابلة مع وسائط الإعلام الاجتماعية، إنه ليس هناك عباقرة غامضين وعميقين، بل هم خريجون من جامعات عليا في البلاد، وطلاب جامعيون في الدكتوراه الرابعة والخامسة، بالإضافة إلى بعض الشباب الذين تخرجوا منذ سنوات قليلة فقط.

يمكن رؤية أكبر خصائص فريق DeepSeek من وسائل الإعلام المفتوحة المتاحة حاليًا هي الجامعات الشهيرة والشبابية، حتى على مستوى قادة الفريق، يكون معظمهم تحت سن 35 عامًا. الفريق الذي لا يتجاوز 140 شخصًا، معظم المهندسين والمطورين يأتون من جامعات صينية رائدة مثل جامعة تسينغهوا، جامعة بكين، جامعة سنغوا، جامعة البريد والاتصالات في بكين، ولا يعملون لفترة طويلة.

قال باحث عن الكفاءات مسؤول عن استخراج المواهب العلمية والتكنولوجية الراقية في مجال النماذج الكبيرة للصحيفة إن منطق التوظيف في DeepSeek لا يختلف كثيرا عن منطق التوظيف للشركات الأخرى في مجال النماذج الكبيرة ، والتسمية الأساسية للمواهب هي "الشباب والإمكانات العالية" ، أي أن العمر ولد في عام 1998 ، ويجب ألا تتجاوز خبرة العمل خمس سنوات ، "ذكية ، علوم وهندسة ، شابة ، وأقل خبرة". ”

ومع ذلك، قالت الشركة التي تقدم خدمات البحث عن الكفاءات المتخصصة سابقًا إن شركات النموذج الكبير للأعمال الناشئة هي في الأساس شركات ناشئة، وليس لديها رغبة في جلب أفضل الكفاءات في مجال الذكاء الاصطناعي من الخارج، والواقع هو أن القليل من أفضل الكفاءات في مجال الذكاء الاصطناعي في الخارج يرغبون في العودة.

كشف موظف من ديبسيك الذي رفض الكشف عن اسمه لـ Pengpai Technology أن إدارة الشركة مسطحة للغاية وأن الأجواء المفتوحة للتواصل جيدة بشكل عام. ويتنقل ليانغ ونفينغ بشكل غير منتظم خلال الأيام العادية، ويكون معظم الوقت في تواصل عبر الإنترنت مع الجميع.

سبق لهذا الموظف العمل على تطوير تكنولوجيا النماذج الكبيرة في شركة كبيرة في الصين، ولكنه يشعر بأنه كان مجرد برغي في تلك الشركة ولم يتمكن من خلق قيمة، وأخيرًا اختار الانضمام إلى DeepSeek. بالنسبة له، DeepSeek متخصصة في تقنية النماذج الأساسية.

جو العمل في DeepSeek تمامًا من الأسفل إلى الأعلى ، وهناك توزيع طبيعي للمهام ، ولا يوجد حد أعلى لتحرك الفرد وتحريك الأشخاص. يأتي بأفكاره الخاصة ولا يحتاج إلى تحفيز. عندما يواجه مشكلة أثناء الاستكشاف ، فإنه يقوم بجلب الآخرين لمناقشتها.

“يعتقد أن الذكاء الاصطناعي في الصين قد تجاوز الولايات المتحدة بالفعل، ولكن ذلك لا يزال مبكراً

تحليل Business Insider التجاري الأمريكي يشير إلى أن إصدار R1 الجديد يظهر أن الصين قادرة على منافسة بعض النماذج الرائدة في صناعة الذكاء الاصطناعي والبقاء متزامنة مع التطورات الرائدة في وادي السيليكون الأمريكي؛ وثانياً، فإن الذكاء الاصطناعي المتقدم المفتوح قد يشكل تحدياً لتلك الشركات التي تحاول الحصول على أرباح هائلة من خلال بيع التكنولوجيا.

ومع ذلك، فإن التصريح بأن "الذكاء الاصطناعي الصيني قد تجاوز الولايات المتحدة" في الوقت الحالي قد يكون مبالغا فيه. وأشار ليو Zhiyuan علناً إلى ضرورة توخي الحذر في تحول الرأي العام من التشاؤم المفرط إلى التفاؤل المفرط، معتبرًا أننا لم نصل بعد إلى مرحلة التفوق الشامل والبعيد. ويعتقد ليو Zhiyuan أن التكنولوجيا الجديدة AGI ما زالت في مرحلة التطور السريع، ومسار التطور المستقبلي غير محدد بعد، وأن الصين ما زالت في مرحلة اللحاق بالآخرين، وعلى الرغم من أنها لم تعد بعيدة المنال، إلا أنها تعتبر قابلة للوصول بعد، "فمن السهل نسبيًا الجري بسرعة في الطريق الذي اكتشفه الآخرون، ولكن الصعوبة الأكبر تكمن في كيفية فتح طريق جديد في الضباب المتقدم".

"الآن كل شيء مشوش جدًا، والجميع مستعجلون جدًا، ولا يدركون أن DeepSeek في النهاية تمكن من الخروج." قال شخص قريب من DeepSeek لـ Pengpai Technology، إن سرعة تغير الصناعة سريعة جدًا، ولا يمكن التنبؤ بما يمكن القيام به في الخطوة التالية، يمكن فقط مراقبة تغيرات الربع الثالث Q3 القادمة."

من جهة، يعترف ديميس هاسابيس بأن الصين لديها قدرة هندسية قوية جدًا وقدرة على التوسع بشكل كبير، ومن جهة أخرى، يشير إلى أن الغرب لا يزال في الصدارة ويحتاج إلى التفكير في كيفية الحفاظ على مكانته الرائدة في نماذج الحافة الغربية.

على الرغم من أن Liang Wenfeng قد صرح سابقاً أن DeepSeek لا تقوم سوى ببناء النماذج ولا تنتج منتجات، إلا أنه كشركة تجارية، فإنه من المستحيل تقريباً القيام ببناء النماذج فقط دون إنتاج منتجات. في 15 يناير، تم إصدار تطبيق DeepSeek الرسمي. وقال مقربون من DeepSeek لـPengpai Technology أن عملية التجارة قد تم رفعها على جدول أعمال DeepSeek.

في نظر المهنيين في الصناعة، يعتبر DeepSeek محظوظًا مقارنةً بشركات النماذج الرياضية الكبيرة الأخرى في الصين، حيث لا يواجه ضغوط التمويل ولا يحتاج إلى إثبات نفسه أمام المستثمرين ولا يحتاج إلى مواجهة تحديات تطوير التكنولوجيا النموذجية وتحسين تطبيقات المنتج. ومع ذلك، كشركة تجارية، مع استثمارات ضخمة، ستواجه في وقت ما ضغوطًا وتحديات مماثلة لتلك التي تواجهها الشركات الأخرى في هذا المجال. يعتبر المهنيون في شركات النماذج السابقة أن هذا النجاح الحالي لشركة DeepSeek هو نتيجة لحملة تسويق ناجحة قبل التجارة ومن المستبعد معرفة ما إذا كانت ستستمر في التقدم بعد التجارة الفعلية.

ما هو مؤكد هو أن DeepSeek ستواجه المزيد من الضغوط والتحديات في المستقبل ، وأن السباق إلى نموذج عالمي قد بدأ للتو ، ومن سيفوز سيعتمد على الاستثمار المستمر للمال وتكرار التكنولوجيا. ومع ذلك ، يعتقد المطلعون على الصناعة أيضا أنه "بالنسبة لصناعة النماذج المحلية ، من الجيد أن يكون لديك شركة ذات قوة تقنية حقيقية مثل DeepSeek تنضم". ”

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت