None
Brief news summary
Noneتطور الروبوتات البشرية قد تقدم ببطء على مدى ما يقرب من عقدين من الزمان. ومع ذلك، بفضل التعاون بين شركتي Figure AI و OpenAI، هناك تسارع سريع في هذا المجال. الناتج هو فيديو مذهل يستعرض روبوت Figure 01 بلغته الجديدة للتعبير البصري (VLM)، مما حوله إلى روبوت خيال علمي بقدرات قريبة من تلك الخاصة بـ C-3PO. في الفيديو، يتم وضع Figure 01 خلف طاولة تحتوي على صحن وتفاحة وكوب، في حين يكون منعقد إلى اليسار. يقف إنسان أمام الروبوت ويسأل: "Figure 01، ما الذي تراه الآن؟" بعد لحظات قليلة، يجيب Figure 01 بصوت شبيه جداً بصوت الإنسان (على الرغم من عدم وجود وجه) ويقدم وصفاً مفصلاً لكل شيء على الطاولة والشخص أمامه. معجباً، رأيت ذلك وقلت: "هذا رائع. " ثم يسأل الشخص: "يا، هل يمكنني أن آخذ شيئاً لأتناوله؟" يجيب Figure 01 بثقة: "بالطبع"، ويمسك بالتفاحة ويسلمها للشخص بمهارة. لم أستطع إلا أن أعبّر قائلاً: "يا إلهي. " بعد ذلك، يفرغ الشخص بعض الحطام المجعد من سلة أمام Figure 01 مع سؤاله: "هل يمكنك أن تشرح لماذا فعلت ما فعلته بينما تلتقط هذه القمامة؟" دون إهدار أي وقت، يشرح Figure 01 تفكيره بينما يضع الورقة مرة أخرى في السلة، "لذلك، أعطيتك التفاحة لأنها هي العنصر القابل للأكل الوحيد الذي يمكنني تقديمه لك من الطاولة. " بعد أن أبهرني ذلك، تأملت قائلاً: "لا يمكن أن يكون حقيقياً. " ومع ذلك، وفقاً لشركة Figure AI، إنه حقيقة بالفعل. التفكير من خلال النصوص إلى الكلام يلعب دورًا كبيرًا في قدرات Figure 01، حيث يستخدم نموذج VLM المتعدد الوسائط المُدرَّب مسبقًا من OpenAI لفهم الصور والنصوص. يعتمد على التفاعل الصوتي لإيجاد استجاباته، مما يميزه عن GPT-4 من OpenAI الذي يركز بشكل أساسي على المحفزات المكتوبة. علاوة على ذلك، يعتمد Figure 01 على تقنية تدعى "تلاعب ثنائي اليد تعلمه".
يجمع النظام بين عمليات المعايرة الدقيقة للصور وشبكة الأعصاب للتحكم في حركاته، ويعمل بدقة على مستوى البكسل. صرحت Figure AI: "تتعامل هذه الشبكات مع الصور الموجودة في الروبوت عند 10 هرتز وتولد إجراءات تشمل 24 درجة حرية (وضعية المعصم وزوايا مفصل الأصابع) عند 200 هرتز". تدّعي Figure AI أن كل سلوك يظهر في الفيديو هو نتيجة تعلم النظام، وأن Figure 01 لا يعمل بالتحكم عن بُعد، ما يبطل أي افتراضات بأنها تعمل بالتوجيه خلف الكواليس. بدون أن أشاهد Figure 01 بنفسي وأطرح أسئلتي الخاصة، من الصعب التحقق من هذه الادعاءات. قد يكون هناك احتمال لتمرين هذا الروتين عدة مرات بواسطة Figure 01. ربما هذه هي المرة المئة، مما يفسر السرعة والانسيابية المذهلة. ولكن في حالة أن يثبت أن هذا حقيقي بنسبة 100%، يجب أن أقول: "واو". مجرد "واو".
Watch video about
None
Try our premium solution and start getting clients — at no cost to you