ديب سيك V3: الكشف عن النموذج المفتوح الرائد للذكاء الاصطناعي في الصين

كشفت مختبرات صينية عن واحد من أقوى نماذج الذكاء الاصطناعي "المفتوحة" حتى الآن، يُطلق عليه DeepSeek V3. طُور من قبل شركة الذكاء الاصطناعي DeepSeek وأُطلق يوم الأربعاء بترخيص مرن، مما يسمح للمطورين بتنزيله وتعديله لمعظم الاستخدامات، بما في ذلك التطبيقات التجارية. يتفوق DeepSeek V3 في العديد من المهام المستندة إلى النصوص مثل البرمجة، الترجمة، وكتابة المقالات والبريد الإلكتروني من خلال الإرشادات. وفقًا لاختبارات DeepSeek الداخلية، يتفوق DeepSeek V3 على النماذج "المفتوحة" القابلة للتنزيل ونماذج الذكاء الاصطناعي "المغلقة" التي لا يمكن الوصول إليها إلا عبر واجهة برمجة التطبيقات. في مسابقات البرمجة على Codeforces، يتفوق DeepSeek على النماذج الأخرى، بما في ذلك Meta’s Llama 3. 1 405B، وOpenAI’s GPT-4o، وAlibaba’s Qwen 2. 5 72B. يتفوق أيضًا في اختبار Aider Polyglot، الذي يهدف إلى تقييم قدرة النموذج على كتابة أكواد جديدة تتكامل مع الأكواد الموجودة بالفعل. تم تدريب DeepSeek V3 على مجموعة بيانات تحتوي على 14. 8 تريليون وحدة معالجة. في علم البيانات، تمثل الوحدات قطعًا من البيانات الخام، مع اعتبار أن مليون وحدة تعادل تقريبًا 750, 000 كلمة. يتميز النموذج أيضًا بضخامته، حيث يحتوي على 671 مليار معامل (أو 685 مليار على منصة تطوير الذكاء الاصطناعي Hugging Face)، وهي المتغيرات الداخلية التي تستخدمها النماذج لاتخاذ القرارات. هذا الحجم يبلغ حوالي 1. 6 ضعف النموذج Llama 3. 1 405B بـ405 مليارات معامل. عادةً، النماذج ذات المعاملات الأكبر تؤدي بشكل أفضل، لكنها تتطلب أيضًا أجهزة قوية لتعمل بكفاءة. يحتاج نموذج DeepSeek V3 غير المحسّن إلى مجموعة من وحدات معالجة الرسومات عالية الأداء لتحقيق سرعة معقولة. رغم عدم عمليته، يعتبر DeepSeek V3 إنجازًا. دربت DeepSeek النموذج في غضون شهرين تقريبًا باستخدام مركز بيانات يحتوى على وحدات معالجة الرسومات Nvidia H800، والتي مُنعت الشركات الصينية مؤخرًا من الحصول عليها من قبل وزارة التجارة الأمريكية.
وتزعم الشركة أنها أنفقت فقط 5. 5 مليون دولار لتدريب DeepSeek V3، وهو جزء صغير من تكلفة نماذج مثل OpenAI’s GPT-4. ومع ذلك، فإن وجهات النظر السياسية للنموذج مقيدة إلى حد ما. على سبيل المثال، لن يعلق على موضوع ميدان تيانانمن. باعتبارها شركة صينية، تخضع DeepSeek لتنظيم الإنترنت الصيني، مما يضمن أن ردود النموذج تدعم "القيم الاشتراكية الأساسية". تتجنب العديد من أنظمة الذكاء الاصطناعي الصينية المواضيع التي قد تزعج المنظمين، مثل المناقشات حول نظام شي جين بينغ. DeepSeek، التي قدمت مؤخرًا DeepSeek-R1 كمنافس لنموذج o1 "التفكير" من OpenAI، هي منظمة مثيرة للاهتمام. يدعمها High-Flyer Capital Management، وهو صندوق تحوط صيني يستخدم الذكاء الاصطناعي للتداول. تقوم High-Flyer ببناء تجمعات خوادمها الخاصة لتدريب النماذج، أحدها يضم 10, 000 من وحدات معالجة الرسومات Nvidia A100 ويكلف 1 مليار ين (~138 مليون دولار). تأسست على يد ليانغ وينفينغ، خريج علوم الحاسوب، وتهدف High-Flyer إلى تحقيق ذكاء اصطناعي "فائق الذكاء" من خلال DeepSeek. وصف وينفينغ في مقابلة في وقت سابق من هذا العام الذكاء الاصطناعي مغلق المصدر مثل OpenAI بأنه "ميزة مؤقتة". وأشار قائلاً: "[هذا] لم يمنع الآخرين من اللحاق بالركب". بالطبع.
Brief news summary
أطلقت شركة ديب سيك، وهي شركة رائدة في مجال الذكاء الاصطناعي في الصين، نموذجًا جديدًا مفتوح المصدر أطلقت عليه اسم ديب سيك V3. يتيح هذا النموذج للمطورين تنزيله وتعديله واستخدامه لأغراض متنوعة، بما في ذلك التطبيقات التجارية. يتميز ديب سيك V3 في مهام البرمجة والترجمة والكتابة، وغالبًا ما يتفوق على منافسين مثل ميتا وOpenAI وعلي بابا في المعايير القياسية. ترجع قدرات هذا النموذج إلى تدريبه الشامل على مجموعة بيانات ضخمة تضم 14.8 تريليون رمز و671 مليار معامل، وهو ما يتجاوز نموذج Llama 3.1 من ميتا الذي يحتوي على 405 مليارات معامل. تتطلب هذه المجموعة الواسعة من البيانات أجهزة قوية للحصول على الاستخدام الأمثل. استخدمت ديب سيك وحدات معالجة الرسومات Nvidia H800 لمدة شهرين، مما أسفر عن عملية تدريب فعّالة من حيث التكلفة مقارنة بـ GPT-4 من OpenAI. على الرغم من قوته، يواجه النموذج تحديات في التعامل مع المواضيع الحساسة سياسيًا مثل ساحة تيانانمن، للتوافق مع القوانين الصينية. تدعم شركة هاي فلاير كابيتال مانجمنت ديب سيك من خلال الاستثمار في البنية التحتية لخوادم الذكاء الاصطناعي، بما في ذلك مجموعات كبيرة من وحدات معالجة الرسومات من Nvidia، بهدف تحقيق تقدم في أنظمة الذكاء الاصطناعي نحو أنظمة "فائقة الذكاء" والتغلب على قيود الذكاء الاصطناعي المغلق المصدر.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

جوجل تكشف عن وحدة المعالجة التوترية Ironwood للذك…
كشفت جوجل عن أحدث تقدم لها في مجال أجهزة الذكاء الاصطناعي: معالج Ironwood TPU، وهو أكثر معجلات الذكاء الاصطناعي تخصصًا تطوره حتى الآن.

ما وراء الضوضاء: السعي نحو غدٍ ملموس لتقنية البلوك…
لقد نضج مشهد البلوكشين إلى ما هو أبعد من مجرد تكهنات مبكرة ليصبح مجالًا يتطلب قيادات ذات رؤية تربط بين الابتكار المتقدم والفائدة الواقعية.

الذكاء الاصطناعي في الترفيه: إنشاء تجارب الواقع ا…
الذكاء الاصطناعي يُحَوِّل صناعة الترفيه بشكل كبير من خلال تعزيز تجارب الواقع الافتراضي (VR) بشكل كبير.

البلوكشين تتولى مهمة سجلات الممتلكات الكبيرة في ن…
تخصص واحدة من أكبر المقاطعات في الولايات المتحدة دورًا هامًا جديدًا للبلوك تشين: إدارة سجلات الممتلكات.

كواين يطلق أول إعلان تلفزيوني كامل تم إنشاؤه بواس…
شركة كوان، وهي شركة بطاقات ائتمان تركز على المستهلكين المحافظين، أطلقت ما تسميه أول إعلان تجاري وطني يُنتج بالكامل باستخدام الذكاء الاصطناعي في صناعة الخدمات المالية.

شركة Bitzero Blockchain المدعومة من Mr. Wonderful…
ووفقًا لما تدعيه الشركة من "دمج ملكية الأصول، والطاقة المتجددة منخفضة التكلفة، والارتقاء الاستراتيجي لأجهزة التعدين"، فقد "طورت نموذجًا أكثر ربحية لكل وحدة من الإيرادات من المعدنين التقليديين، حتى في ظروف ما بعد النصف".

أبرز مؤتمر قمة الذكاء الاصطناعي تأثير الذكاء الاص…
في مؤتمر الذكاء الاصطناعي+ الأخير في نيويورك، تجمع خبراء وقادة صناعة لاستكشاف التأثير المتزايد بسرعة للذكاء الاصطناعي عبر قطاعات متعددة.