На металевих дверях у районі Мішн, Сан-Франциско, символ "π" натякає на інноваційну роботу, що відбувається всередині. Цей простір належить Physical Intelligence (PI або π), стартапу, який прагне підвищити інтелект роботів, залучивши величезні інвестиції, такі як $400 мільйонів від OpenAI і Джеффа Безоса. Компанія мріє наділити роботів людським розумінням та спритністю через обширні дані датчиків і рухів, які надходять в модель штучного інтелекту. Всередині активність інтенсивна: роботи складають футболки та переміщують предмети, а чоловік керує щипцями з вебкамерою. Засновники компанії, включаючи генерального директора Карола Гаусмана, передбачають, що ШІ дозволить роботам адаптуватися до нових завдань через інтуїтивне керування, а не через точне програмування. Натхнені успіхом великих мовних моделей (LLM), таких як ChatGPT, вони вірять, що подібні досягнення можливі й у робототехніці. Раніше LLM демонстрували, як вони можуть вирішувати відкриті завдання без традиційного програмування. З удосконаленням цих мовних моделей через модель бачення, роботи набули обмеженого розуміння свого оточення, що дозволило робити обґрунтованіші дії. Публічна демонстрація підкреслила потенціал, коли глядачі керували роботом через континенти, демонструючи його навички вирішення проблем. Для поліпшення фізичних здібностей Physical Intelligence співпрацює з іншими установами, збираючи дані з різних завдань за допомогою трансформерних моделей.
Цей підхід показує обнадійливі результати, натякаючи на надзвичайні навички роботів у майбутньому, подібно до прогресу дитини від основного захоплення до гри на піаніно завдяки широкому навчанню. Серед ажіотажу навколо людиноподібних роботів від стартапів і технологічних гігантів деякі експерти висловлюють скептицизм щодо подолання складнощів фізичної взаємодії. Відзначаються занепокоєння щодо гіперболізації та відсутність масштабних даних про дії роботів, оскільки фізичні завдання залучають більше змінних, ніж обробка мови. Проте оптимізм зберігається; роботи можуть навчатися через людські демонстрації, можливо, переглядаючи відео на YouTube, поєднуючи віртуальне і реальне навчання. Physical Intelligence планує розширити свої зусилля, співпрацюючи з іншими компаніями для збору даних з різних робототехнічних завдань. Вони розробляють індивідуальне обладнання, щоб потенційно використовувати натовпне навчання через повсякденні завдання. Недавні розробки у стартапі показують значні успіхи: роботи вміло виконують складні домашні завдання, з рухами, що здаються майже людськими. Використовуючи суміш LLM та моделей генерації зображень, команда досягла більш загальних можливостей роботів, подібних до перших моделей OpenAI. Попри деякі кумедні помилки, команда налаштована оптимістично. Їхній "загальний рецепт" для навчання роботів означає захоплюючий прогрес, натякаючи на те, що інтеграція передового ШІ у фізичний світ стає все більш реальною.
Покращення інтелекту роботів: революційний підхід фізичного інтелекту
TechSmith Corporation, визначний лідер у сфері візуальної комунікації, випустила свій дослідження 2024 року про перегляд відео, яке ґрунтовно аналізує глобальну залученість та вподобання глядачів щодо навчальних та інформаційних відео.
Короткий опис Штучний інтелект (ШІ) трансформує команди продажу в Індії, дозволяючи не лише керівникам, а й представникам передової лінії
У червні 2025 року компанія Meta Platforms Inc.
ByteDance випустила Seedance 2.0 менше тижня тому, викликавши обурення серед художників усього світу вірусним відео, згенерованим штучним інтелектом, у якому Том Круз та Бред Пітт борються між собою.
Ідеальний сценарій для офісних працівників — просто натиснути кнопку на пристрої, який записує зустрічі, транскрибує розмови та перетворює їх у робочі завдання.
Microsoft офіційно інтегрував помічника з штучним інтелектом — Copilot — у широко використовуваний офісний пакет, що стане значним кроком уперед у взаємодії користувачів із програмним забезпеченням для підвищення продуктивності.
Seedance 2.0 — це сучасна модель перетворення зображень у відео та тексту у відео, створена технологічною компанією ByteDance.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today