lang icon En
Nov. 4, 2025, 5:28 a.m.
2690

أطلقت شركة ByteDance نموذج جيكو: الذكاء الاصطناعي مفتوح المصدر لتحويل النص إلى فيديو، مما يمثل تحديًا لنموذج سورا من OpenAI

Brief news summary

مجال تحويل النص إلى فيديو باستخدام الذكاء الاصطناعي يتطور بسرعة، وتظهر ذلك من خلال Sora من OpenAI و Goku من ByteDance. تولد Sora فيديوهات فائقة الواقعية من نصوص باستخدام نماذج انتشار متقدمة، مع تحقيق جودة بصرية عالية وحركة سلسة، على الرغم من أنها تظل ملكية خاصة وأقل وصولاً. بالمقابل، يعتبر Goku نموذجاً مفتوح المصدر يشجع على ديمقرة صناعة الفيديو باستخدام الذكاء الاصطناعي من خلال التعاون المجتمعي. يستخدم أساليب مبتكرة مثل Rectified Flow للحركة السلسة، ونموذج Autoencoder ثلاثي الأبعاد يدمج الصورة والفيديو للحفاظ على التفاصيل، وشبكة Transformer بانتباها الكامل لالتقاط الديناميات المعقدة للمكان والزمان. بينما تتفوق Sora من حيث الجودة البصرية، فإن طبيعة Goku المفتوحة تسرع الابتكار عبر المساهمات الجماعية. معاً، تشير هذه التطورات إلى مستقبل تصبح فيه الفيديوهات المُولدة باستخدام الذكاء الاصطناعي شائعة في الأفلام والتسويق والتعليم، على الرغم من التحديات الأخلاقية وتهديدات التزييف العميق. يبرز Goku من ByteDance الاتجاه نحو إنشاء محتوى رقمي متعاون ومتيسر باستخدام الذكاء الاصطناعي.

مجال تحويل النص إلى فيديو باستخدام الذكاء الاصطناعي يتقدم بسرعة، مع تحقيق إنجازات توسع القدرات بشكل متزايد. أذهلت سورا من OpenAI الجمهور من خلال توليد فيديوهات عالية الجودة وواقعية بشكل فائق من أوامر نصية بسيطة. الآن، أطلقت ByteDance (الشركة الأم لـ TikTok) منافسًا جديدًا: غوكو، نموذج توليد فيديو باستخدام الذكاء الاصطناعي مفتوح المصدر. على عكس سورا المغلقة المصدر، يهدف تصميم غوكو المفتوح المصدر إلى democratization صناعة الفيديو باستخدام الذكاء الاصطناعي وتعزيز الابتكار من خلال التعاون المجتمعي. لنستكشف ميزات غوكو، وكيف يقارن بسورا، وما هي التداعيات لمستقبل الفيديو المنتج باستخدام الذكاء الاصطناعي. **ما هو غوكو؟** غوكو هو نموذج ذكاء اصطناعي متطور لتحويل النص إلى فيديو يُنتج مقاطع فيديو متماسكة عالية الجودة وواقعية استنادًا إلى أوصاف نصية. وعلى الرغم من أنه لم يُطلق بشكل كامل للجمهور حتى الآن، تشير التقارير الأولية إلى أنه من بين أكثر مولدات الفيديو بالذكاء الاصطناعي تقدمًا. **ميزات رئيسية لغوكو** - *صيغة التدفق المصحح (RF)*: تضمن حركة سلسة ومتسقة من خلال تجنب الاعتمادية على الإطارات المستقلة التي تعتبر سمة شائعة في النماذج التقليدية، مما يتيح تدفق فيديو أكثر طبيعية. - *مشفر تلقائي متفاوت ثلاثي الأبعاد (VAE) للصور والفيديوهات المشتركة*: يضغط الصور والفيديوهات في مساحة كامنة مشتركة، مما يعزز الكفاءة preserves التفاصيل عالية الدقة. - *شبكة تحويلية ذات انتباه كامل*: تستخدم FlashAttention و3D RoPE لدمج المواقع المكانية والزمانية، مما ينتج فيديوهات ديناميكية بحركات واقعية للأشياء. - *توفر مفتوح المصدر*: على عكس سورا المملوكة، فإن توفر غوكو بشكل مفتوح يشجع المطورين والباحثين والهواة على التجربة والابتكار، مما قد يسهم في تسريع تقدم تقنيات الفيديو بالذكاء الاصطناعي. **مقارنة بين غوكو وسورا** يختلف غوكو من ByteDance وسورا من OpenAI بشكل رئيسي من حيث الوصول والطريقة.

طبيعة غوكو المفتوحة المصدر تدعو إلى تطوير مجتمعي، مما يعزز الانتشار السريع والتقدم الملحوظ. سورا تظل مملوكة ومغلقة المصدر، مما يحد من التجارب خارج نطاق OpenAI. تقنيًا، يستفيد غوكو من تقنيات مثل التدفق المصحح، وVAE ثلاثي الأبعاد، وشبكة تحويل ذات انتباه كامل؛ في حين تستخدم سورا نماذج انتشار وشبكات عصبونية عميقة مُحسنة لتوليد فيديوهات طويلة المدى. يُشاد بسورا لإنتاجه فيديوهات واقعية ومتسقة جداً ولكن مع قيود على الوصول، بينما يُظهر غوكو، رغم كونه في مراحله المبكرة، إمكانيات واعدة في الابتكار من خلال انفتاحه. **مستقبل توليد الفيديو بالذكاء الاصطناعي** يُعَد ظهور غوكو وسورا بداية لثورة في مجال الفيديو بالذكاء الاصطناعي، مع توقعات لــ: - انتشار صناعة الفيديو المدعومة بالذكاء الاصطناعي بشكل واسع، وجعل إنتاج الفيديو عالي الجودة في متناول العديد. - زيادة المنافسة المفتوحة المصدر، حيث قد تلهم منهجية ByteDance الآخرين، مما يسرع التقدم التكنولوجي. - صناعة أفلام ومسلسلات كاملة بالذكاء الاصطناعي، مع قيام الذكاء الاصطناعي بكتابة السيناريوهات، والإخراج، والتحريك. - تحديات أخلاقية، تشمل سوء استخدام تقنية التزييف العميق، والمعلومات المضللة، وخصوصية المستخدمين، مما يستدعي تنظيمًا لضمان الاستخدام المسؤول للذكاء الاصطناعي. **اختتامًا: عصر جديد لفيديو الذكاء الاصطناعي** يشير غوكو من ByteDance إلى طفرة مهمة في تكنولوجيا الفيديو بالذكاء الاصطناعي عبر نموذجه المفتوح، الذي قد يُحدث ثورة في صناعة السينما والتلفزيون الرقمية ويقربها من الجمهور بشكل أكبر ويُسرع الابتكار مقارنة مع سورا المغلقة المصدر من OpenAI. وعلى الرغم من أنه لا يزال في مراحله الأولية، فإن تأثير غوكو المحتمل يمتد ليشمل الترفيه، والتعليم، والتسويق، وما يتجاوزها. ومع تطور تقنية الفيديو باستخدام الذكاء الاصطناعي، يظل السؤال الأهم: هل ستتفوق المشاريع مفتوحة المصدر مثل غوكو على النماذج المملوكة مثل سورا؟ وقد يعيد ذلك رسم مستقبل صناعة المحتوى الرقمي. تابعونا للمزيد من التحديثات!


Watch video about

أطلقت شركة ByteDance نموذج جيكو: الذكاء الاصطناعي مفتوح المصدر لتحويل النص إلى فيديو، مما يمثل تحديًا لنموذج سورا من OpenAI

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 31, 2025, 1:38 p.m.

هل أنت خائف من الذكاء الاصطناعي؟ قانون جديد يفرض …

ابتداءً من الأول من يناير، يُطبق قانون جديد وقعه حاكم كاليفورنيا جافين نيوزوم، يتطلب من شركات التكنولوجيا التي تطور نماذج ذكاء اصطناعي متقدمة وكبيرة، مثل Google وOpenAI،زيادة الشفافية بشأن الأثر المجتمعي وحماية الموظفين الذين يثيرون مخاوف تتعلق بالسلامة.

Dec. 31, 2025, 1:25 p.m.

فترات الحجز الأقصر تتطلب تسويقًا أذكى: كيف يمكن لل…

يشهد قطاع السفر تحولًا عميقًا في سلوك المستهلك يتجاوز التقلبات الاقتصادية المعتادة.

Dec. 31, 2025, 1:23 p.m.

تأثير وضع الذكاء الاصطناعي على حركة البحث واسترات…

وضع الذكاء الاصطناعي (AI) يُحدث تحولًا سريعًا في تحسين محركات البحث (SEO) من خلال تقديم ميزات مبتكرة وتحديات للممارسات التقليدية.

Dec. 31, 2025, 1:20 p.m.

تحسين أدوات مؤتمرات الفيديو المدعومة بالذكاء الاص…

الذكاء الاصطناعي يُحول بشكل كبير التعاون عن بُعد بين الفرق، خاصة من خلال تحسين أدوات المؤتمرات المرئية.

Dec. 31, 2025, 1:14 p.m.

العشرة قوانين لتوظيف نائب رئيس المبيعات في عصر ال…

تبقى المسرحيات كما هي، لكن القواعد قد تغيرت بشكل كبير—إليك ما يهم حقًا الآن.

Dec. 31, 2025, 9:31 a.m.

تمكين توليف الفيديو باستخدام الذكاء الاصطناعي من …

ثورة تركيب الفيديو بالذكاء الاصطناعي تُحدث تحولًا كبيرًا في الترجمة الفورية للغات في الفيديوهات، مُكسرة حواجز التواصل في عصر العولمة السريع والتواصل المتزايد، تظل حواجز اللغة تشكل تحديًا كبيرًا أمام التواصل السلس وتبادل المعلومات

Dec. 31, 2025, 9:24 a.m.

قد تكون استحواذ شركة ميتا على Manus AI بقيمة تصل …

تُعد استحواذ شركة ميتا الأخير على Manus AI علامة بارزة في التوسع الاستراتيجي لعملاق التكنولوجيا نحو قطاع الذكاء الاصطناعي المؤسسي.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today