ديب سيك V3: الكشف عن النموذج المفتوح الرائد للذكاء الاصطناعي في الصين
Brief news summary
أطلقت شركة ديب سيك، وهي شركة رائدة في مجال الذكاء الاصطناعي في الصين، نموذجًا جديدًا مفتوح المصدر أطلقت عليه اسم ديب سيك V3. يتيح هذا النموذج للمطورين تنزيله وتعديله واستخدامه لأغراض متنوعة، بما في ذلك التطبيقات التجارية. يتميز ديب سيك V3 في مهام البرمجة والترجمة والكتابة، وغالبًا ما يتفوق على منافسين مثل ميتا وOpenAI وعلي بابا في المعايير القياسية. ترجع قدرات هذا النموذج إلى تدريبه الشامل على مجموعة بيانات ضخمة تضم 14.8 تريليون رمز و671 مليار معامل، وهو ما يتجاوز نموذج Llama 3.1 من ميتا الذي يحتوي على 405 مليارات معامل. تتطلب هذه المجموعة الواسعة من البيانات أجهزة قوية للحصول على الاستخدام الأمثل. استخدمت ديب سيك وحدات معالجة الرسومات Nvidia H800 لمدة شهرين، مما أسفر عن عملية تدريب فعّالة من حيث التكلفة مقارنة بـ GPT-4 من OpenAI. على الرغم من قوته، يواجه النموذج تحديات في التعامل مع المواضيع الحساسة سياسيًا مثل ساحة تيانانمن، للتوافق مع القوانين الصينية. تدعم شركة هاي فلاير كابيتال مانجمنت ديب سيك من خلال الاستثمار في البنية التحتية لخوادم الذكاء الاصطناعي، بما في ذلك مجموعات كبيرة من وحدات معالجة الرسومات من Nvidia، بهدف تحقيق تقدم في أنظمة الذكاء الاصطناعي نحو أنظمة "فائقة الذكاء" والتغلب على قيود الذكاء الاصطناعي المغلق المصدر.كشفت مختبرات صينية عن واحد من أقوى نماذج الذكاء الاصطناعي "المفتوحة" حتى الآن، يُطلق عليه DeepSeek V3. طُور من قبل شركة الذكاء الاصطناعي DeepSeek وأُطلق يوم الأربعاء بترخيص مرن، مما يسمح للمطورين بتنزيله وتعديله لمعظم الاستخدامات، بما في ذلك التطبيقات التجارية. يتفوق DeepSeek V3 في العديد من المهام المستندة إلى النصوص مثل البرمجة، الترجمة، وكتابة المقالات والبريد الإلكتروني من خلال الإرشادات. وفقًا لاختبارات DeepSeek الداخلية، يتفوق DeepSeek V3 على النماذج "المفتوحة" القابلة للتنزيل ونماذج الذكاء الاصطناعي "المغلقة" التي لا يمكن الوصول إليها إلا عبر واجهة برمجة التطبيقات. في مسابقات البرمجة على Codeforces، يتفوق DeepSeek على النماذج الأخرى، بما في ذلك Meta’s Llama 3. 1 405B، وOpenAI’s GPT-4o، وAlibaba’s Qwen 2. 5 72B. يتفوق أيضًا في اختبار Aider Polyglot، الذي يهدف إلى تقييم قدرة النموذج على كتابة أكواد جديدة تتكامل مع الأكواد الموجودة بالفعل. تم تدريب DeepSeek V3 على مجموعة بيانات تحتوي على 14. 8 تريليون وحدة معالجة. في علم البيانات، تمثل الوحدات قطعًا من البيانات الخام، مع اعتبار أن مليون وحدة تعادل تقريبًا 750, 000 كلمة. يتميز النموذج أيضًا بضخامته، حيث يحتوي على 671 مليار معامل (أو 685 مليار على منصة تطوير الذكاء الاصطناعي Hugging Face)، وهي المتغيرات الداخلية التي تستخدمها النماذج لاتخاذ القرارات. هذا الحجم يبلغ حوالي 1. 6 ضعف النموذج Llama 3. 1 405B بـ405 مليارات معامل. عادةً، النماذج ذات المعاملات الأكبر تؤدي بشكل أفضل، لكنها تتطلب أيضًا أجهزة قوية لتعمل بكفاءة. يحتاج نموذج DeepSeek V3 غير المحسّن إلى مجموعة من وحدات معالجة الرسومات عالية الأداء لتحقيق سرعة معقولة. رغم عدم عمليته، يعتبر DeepSeek V3 إنجازًا. دربت DeepSeek النموذج في غضون شهرين تقريبًا باستخدام مركز بيانات يحتوى على وحدات معالجة الرسومات Nvidia H800، والتي مُنعت الشركات الصينية مؤخرًا من الحصول عليها من قبل وزارة التجارة الأمريكية.
وتزعم الشركة أنها أنفقت فقط 5. 5 مليون دولار لتدريب DeepSeek V3، وهو جزء صغير من تكلفة نماذج مثل OpenAI’s GPT-4. ومع ذلك، فإن وجهات النظر السياسية للنموذج مقيدة إلى حد ما. على سبيل المثال، لن يعلق على موضوع ميدان تيانانمن. باعتبارها شركة صينية، تخضع DeepSeek لتنظيم الإنترنت الصيني، مما يضمن أن ردود النموذج تدعم "القيم الاشتراكية الأساسية". تتجنب العديد من أنظمة الذكاء الاصطناعي الصينية المواضيع التي قد تزعج المنظمين، مثل المناقشات حول نظام شي جين بينغ. DeepSeek، التي قدمت مؤخرًا DeepSeek-R1 كمنافس لنموذج o1 "التفكير" من OpenAI، هي منظمة مثيرة للاهتمام. يدعمها High-Flyer Capital Management، وهو صندوق تحوط صيني يستخدم الذكاء الاصطناعي للتداول. تقوم High-Flyer ببناء تجمعات خوادمها الخاصة لتدريب النماذج، أحدها يضم 10, 000 من وحدات معالجة الرسومات Nvidia A100 ويكلف 1 مليار ين (~138 مليون دولار). تأسست على يد ليانغ وينفينغ، خريج علوم الحاسوب، وتهدف High-Flyer إلى تحقيق ذكاء اصطناعي "فائق الذكاء" من خلال DeepSeek. وصف وينفينغ في مقابلة في وقت سابق من هذا العام الذكاء الاصطناعي مغلق المصدر مثل OpenAI بأنه "ميزة مؤقتة". وأشار قائلاً: "[هذا] لم يمنع الآخرين من اللحاق بالركب". بالطبع.
Watch video about
ديب سيك V3: الكشف عن النموذج المفتوح الرائد للذكاء الاصطناعي في الصين
Try our premium solution and start getting clients — at no cost to you