lang icon En
Nov. 14, 2024, 10:19 p.m.
3910

Покращення інтелекту роботів: революційний підхід фізичного інтелекту

Brief news summary

Стартап Physical Intelligence з району Mission у Сан-Франциско революціонізує робототехніку, розвиваючи здатність роботів розуміти фізичний світ за допомогою передових технологій штучного інтелекту. Компанія, символом якої є "π", залучила 400 мільйонів доларів від таких відомих інвесторів, як OpenAI та Джефф Бізос. Генеральний директор Кароль Гаусман прагне поліпшити сприйнятливість роботів за допомогою сенсорних даних і даних про рух. Новатори, такі як Сергій Левін і Челсі Фінн, інтегрують принципи моделей мови, подібні до GPT, для підвищення фізичного інтелекту роботів. Розробки компанії включають роботів, здатних виконувати прості завдання за допомогою усних інструкцій. Значним успіхом є робот з однією рукою у штаб-квартирі Google, що успішно виконує завдання з прибирання, підкреслюючи прогрес у моделях зорово-мовного взаєморозуміння. Однак, на відміну від мовних моделей, недостатня кількість даних про фізичні дії є проблемою. Це обмеження викликає занепокоєння щодо досягнення значних проривів без нових стратегій навчання. У відповідь Physical Intelligence досліджує такі джерела, як YouTube, щоб навчити роботів фізичній взаємодії, хоч прогрес просувається повільно. Незважаючи на ці виклики, компанія наполегливо працює над удосконаленням алгоритмів і співпрацею з різними галузями для збирання більшої кількості даних. Розробляючи спеціалізоване обладнання, таке як щипчики з вебкамерою, Physical Intelligence успішно виконує повсякденні завдання, що свідчить про потенційні зміни в сфері автоматизації. Команда залишається оптимістичною щодо майбутнього, в якому роботи матимуть справжнє розуміння та взаємодію з фізичним світом.

На металевих дверях у районі Мішн, Сан-Франциско, символ "π" натякає на інноваційну роботу, що відбувається всередині. Цей простір належить Physical Intelligence (PI або π), стартапу, який прагне підвищити інтелект роботів, залучивши величезні інвестиції, такі як $400 мільйонів від OpenAI і Джеффа Безоса. Компанія мріє наділити роботів людським розумінням та спритністю через обширні дані датчиків і рухів, які надходять в модель штучного інтелекту. Всередині активність інтенсивна: роботи складають футболки та переміщують предмети, а чоловік керує щипцями з вебкамерою. Засновники компанії, включаючи генерального директора Карола Гаусмана, передбачають, що ШІ дозволить роботам адаптуватися до нових завдань через інтуїтивне керування, а не через точне програмування. Натхнені успіхом великих мовних моделей (LLM), таких як ChatGPT, вони вірять, що подібні досягнення можливі й у робототехніці. Раніше LLM демонстрували, як вони можуть вирішувати відкриті завдання без традиційного програмування. З удосконаленням цих мовних моделей через модель бачення, роботи набули обмеженого розуміння свого оточення, що дозволило робити обґрунтованіші дії. Публічна демонстрація підкреслила потенціал, коли глядачі керували роботом через континенти, демонструючи його навички вирішення проблем. Для поліпшення фізичних здібностей Physical Intelligence співпрацює з іншими установами, збираючи дані з різних завдань за допомогою трансформерних моделей.

Цей підхід показує обнадійливі результати, натякаючи на надзвичайні навички роботів у майбутньому, подібно до прогресу дитини від основного захоплення до гри на піаніно завдяки широкому навчанню. Серед ажіотажу навколо людиноподібних роботів від стартапів і технологічних гігантів деякі експерти висловлюють скептицизм щодо подолання складнощів фізичної взаємодії. Відзначаються занепокоєння щодо гіперболізації та відсутність масштабних даних про дії роботів, оскільки фізичні завдання залучають більше змінних, ніж обробка мови. Проте оптимізм зберігається; роботи можуть навчатися через людські демонстрації, можливо, переглядаючи відео на YouTube, поєднуючи віртуальне і реальне навчання. Physical Intelligence планує розширити свої зусилля, співпрацюючи з іншими компаніями для збору даних з різних робототехнічних завдань. Вони розробляють індивідуальне обладнання, щоб потенційно використовувати натовпне навчання через повсякденні завдання. Недавні розробки у стартапі показують значні успіхи: роботи вміло виконують складні домашні завдання, з рухами, що здаються майже людськими. Використовуючи суміш LLM та моделей генерації зображень, команда досягла більш загальних можливостей роботів, подібних до перших моделей OpenAI. Попри деякі кумедні помилки, команда налаштована оптимістично. Їхній "загальний рецепт" для навчання роботів означає захоплюючий прогрес, натякаючи на те, що інтеграція передового ШІ у фізичний світ стає все більш реальною.


Watch video about

Покращення інтелекту роботів: революційний підхід фізичного інтелекту

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 17, 2026, 5:24 a.m.

Дослідження TechSmith 2024 щодо перегляду відео в…

TechSmith Corporation, визначний лідер у сфері візуальної комунікації, випустила свій дослідження 2024 року про перегляд відео, яке ґрунтовно аналізує глобальну залученість та вподобання глядачів щодо навчальних та інформаційних відео.

Feb. 17, 2026, 5:16 a.m.

Штучний інтелект на передовій: Перетворення аналі…

Короткий опис Штучний інтелект (ШІ) трансформує команди продажу в Індії, дозволяючи не лише керівникам, а й представникам передової лінії

Feb. 17, 2026, 5:15 a.m.

Meta Platforms оголошує про інвестицію в розмірі …

У червні 2025 року компанія Meta Platforms Inc.

Feb. 16, 2026, 1:26 p.m.

Компанія ByteDance обіцяє посилити контроль над с…

ByteDance випустила Seedance 2.0 менше тижня тому, викликавши обурення серед художників усього світу вірусним відео, згенерованим штучним інтелектом, у якому Том Круз та Бред Пітт борються між собою.

Feb. 16, 2026, 1:24 p.m.

Штучний інтелект у голосовому диктофоні, який мож…

Ідеальний сценарій для офісних працівників — просто натиснути кнопку на пристрої, який записує зустрічі, транскрибує розмови та перетворює їх у робочі завдання.

Feb. 16, 2026, 1:21 p.m.

Копілот на базі штучного інтелекту від Microsoft:…

Microsoft офіційно інтегрував помічника з штучним інтелектом — Copilot — у широко використовуваний офісний пакет, що стане значним кроком уперед у взаємодії користувачів із програмним забезпеченням для підвищення продуктивності.

Feb. 16, 2026, 9:26 a.m.

Сіданс 2.0

Seedance 2.0 — це сучасна модель перетворення зображень у відео та тексту у відео, створена технологічною компанією ByteDance.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today