Dec. 26, 2024, 8:59 p.m.

ديب سيك V3: الكشف عن النموذج المفتوح الرائد للذكاء الاصطناعي في الصين

Brief news summary

أطلقت شركة ديب سيك، وهي شركة رائدة في مجال الذكاء الاصطناعي في الصين، نموذجًا جديدًا مفتوح المصدر أطلقت عليه اسم ديب سيك V3. يتيح هذا النموذج للمطورين تنزيله وتعديله واستخدامه لأغراض متنوعة، بما في ذلك التطبيقات التجارية. يتميز ديب سيك V3 في مهام البرمجة والترجمة والكتابة، وغالبًا ما يتفوق على منافسين مثل ميتا وOpenAI وعلي بابا في المعايير القياسية. ترجع قدرات هذا النموذج إلى تدريبه الشامل على مجموعة بيانات ضخمة تضم 14.8 تريليون رمز و671 مليار معامل، وهو ما يتجاوز نموذج Llama 3.1 من ميتا الذي يحتوي على 405 مليارات معامل. تتطلب هذه المجموعة الواسعة من البيانات أجهزة قوية للحصول على الاستخدام الأمثل. استخدمت ديب سيك وحدات معالجة الرسومات Nvidia H800 لمدة شهرين، مما أسفر عن عملية تدريب فعّالة من حيث التكلفة مقارنة بـ GPT-4 من OpenAI. على الرغم من قوته، يواجه النموذج تحديات في التعامل مع المواضيع الحساسة سياسيًا مثل ساحة تيانانمن، للتوافق مع القوانين الصينية. تدعم شركة هاي فلاير كابيتال مانجمنت ديب سيك من خلال الاستثمار في البنية التحتية لخوادم الذكاء الاصطناعي، بما في ذلك مجموعات كبيرة من وحدات معالجة الرسومات من Nvidia، بهدف تحقيق تقدم في أنظمة الذكاء الاصطناعي نحو أنظمة "فائقة الذكاء" والتغلب على قيود الذكاء الاصطناعي المغلق المصدر.

كشفت مختبرات صينية عن واحد من أقوى نماذج الذكاء الاصطناعي "المفتوحة" حتى الآن، يُطلق عليه DeepSeek V3. طُور من قبل شركة الذكاء الاصطناعي DeepSeek وأُطلق يوم الأربعاء بترخيص مرن، مما يسمح للمطورين بتنزيله وتعديله لمعظم الاستخدامات، بما في ذلك التطبيقات التجارية. يتفوق DeepSeek V3 في العديد من المهام المستندة إلى النصوص مثل البرمجة، الترجمة، وكتابة المقالات والبريد الإلكتروني من خلال الإرشادات. وفقًا لاختبارات DeepSeek الداخلية، يتفوق DeepSeek V3 على النماذج "المفتوحة" القابلة للتنزيل ونماذج الذكاء الاصطناعي "المغلقة" التي لا يمكن الوصول إليها إلا عبر واجهة برمجة التطبيقات. في مسابقات البرمجة على Codeforces، يتفوق DeepSeek على النماذج الأخرى، بما في ذلك Meta’s Llama 3. 1 405B، وOpenAI’s GPT-4o، وAlibaba’s Qwen 2. 5 72B. يتفوق أيضًا في اختبار Aider Polyglot، الذي يهدف إلى تقييم قدرة النموذج على كتابة أكواد جديدة تتكامل مع الأكواد الموجودة بالفعل. تم تدريب DeepSeek V3 على مجموعة بيانات تحتوي على 14. 8 تريليون وحدة معالجة. في علم البيانات، تمثل الوحدات قطعًا من البيانات الخام، مع اعتبار أن مليون وحدة تعادل تقريبًا 750, 000 كلمة. يتميز النموذج أيضًا بضخامته، حيث يحتوي على 671 مليار معامل (أو 685 مليار على منصة تطوير الذكاء الاصطناعي Hugging Face)، وهي المتغيرات الداخلية التي تستخدمها النماذج لاتخاذ القرارات. هذا الحجم يبلغ حوالي 1. 6 ضعف النموذج Llama 3. 1 405B بـ405 مليارات معامل. عادةً، النماذج ذات المعاملات الأكبر تؤدي بشكل أفضل، لكنها تتطلب أيضًا أجهزة قوية لتعمل بكفاءة. يحتاج نموذج DeepSeek V3 غير المحسّن إلى مجموعة من وحدات معالجة الرسومات عالية الأداء لتحقيق سرعة معقولة. رغم عدم عمليته، يعتبر DeepSeek V3 إنجازًا. دربت DeepSeek النموذج في غضون شهرين تقريبًا باستخدام مركز بيانات يحتوى على وحدات معالجة الرسومات Nvidia H800، والتي مُنعت الشركات الصينية مؤخرًا من الحصول عليها من قبل وزارة التجارة الأمريكية.

وتزعم الشركة أنها أنفقت فقط 5. 5 مليون دولار لتدريب DeepSeek V3، وهو جزء صغير من تكلفة نماذج مثل OpenAI’s GPT-4. ومع ذلك، فإن وجهات النظر السياسية للنموذج مقيدة إلى حد ما. على سبيل المثال، لن يعلق على موضوع ميدان تيانانمن. باعتبارها شركة صينية، تخضع DeepSeek لتنظيم الإنترنت الصيني، مما يضمن أن ردود النموذج تدعم "القيم الاشتراكية الأساسية". تتجنب العديد من أنظمة الذكاء الاصطناعي الصينية المواضيع التي قد تزعج المنظمين، مثل المناقشات حول نظام شي جين بينغ. DeepSeek، التي قدمت مؤخرًا DeepSeek-R1 كمنافس لنموذج o1 "التفكير" من OpenAI، هي منظمة مثيرة للاهتمام. يدعمها High-Flyer Capital Management، وهو صندوق تحوط صيني يستخدم الذكاء الاصطناعي للتداول. تقوم High-Flyer ببناء تجمعات خوادمها الخاصة لتدريب النماذج، أحدها يضم 10, 000 من وحدات معالجة الرسومات Nvidia A100 ويكلف 1 مليار ين (~138 مليون دولار). تأسست على يد ليانغ وينفينغ، خريج علوم الحاسوب، وتهدف High-Flyer إلى تحقيق ذكاء اصطناعي "فائق الذكاء" من خلال DeepSeek. وصف وينفينغ في مقابلة في وقت سابق من هذا العام الذكاء الاصطناعي مغلق المصدر مثل OpenAI بأنه "ميزة مؤقتة". وأشار قائلاً: "[هذا] لم يمنع الآخرين من اللحاق بالركب". بالطبع.

News source

Watch video about

ديب سيك V3: الكشف عن النموذج المفتوح الرائد للذكاء الاصطناعي في الصين

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

ديب سيك V3: الكشف عن النموذج المفتوح الرائد للذكاء الاصطناعي في الصين

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Hot news

يُطلق SMM Deal Finder منصة مدعومة بالذكاء الاصطناع…

اكتشافات الذكاء الاصطناعي أعادت كتابة قواعد التسو…

يعرض MarketsandMarkets دليل التنفيذيين لتحول المب…

شركة OpenAI تتوقف عن خدمة Sora وسط مخاوف من تقنية…

الرئيس التنفيذي لشركة Thomson Reuters يسلط الضوء …

أتمتة إدارة وسائل التواصل الاجتماعي المدعومة بالذ…

القاضي يُوقف خطوة إدارة ترامب لتصنيف شركة الذكاء ا…

AI Company

Sales

Marketing

ديب سيك V3: الكشف عن النموذج المفتوح الرائد للذكاء الاصطناعي في الصين

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Hot news

يُطلق SMM Deal Finder منصة مدعومة بالذكاء الاصطناع…

اكتشافات الذكاء الاصطناعي أعادت كتابة قواعد التسو…

يعرض MarketsandMarkets دليل التنفيذيين لتحول المب…

شركة OpenAI تتوقف عن خدمة Sora وسط مخاوف من تقنية…

الرئيس التنفيذي لشركة Thomson Reuters يسلط الضوء …

أتمتة إدارة وسائل التواصل الاجتماعي المدعومة بالذ…

القاضي يُوقف خطوة إدارة ترامب لتصنيف شركة الذكاء ا…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?