2025: Rok inteligencji fizycznej w AI i robotyce

Najnowsze modele AI wykazują ludzkie zdolności w generowaniu tekstu, audio i wideo na żądanie. Jednak te algorytmy były głównie ograniczone do świata cyfrowego, zamiast wchodzić w interakcje z naszym fizycznym, trójwymiarowym światem. Nawet najbardziej zaawansowane modele napotykają znaczące wyzwania, gdy są stosowane w rzeczywistych scenariuszach, jak trwające zmagania z tworzeniem bezpiecznych i niezawodnych samochodów autonomicznych. Mimo że te modele są sztucznie inteligentne, często brakuje im zrozumienia fizyki i często generują omamy, prowadząc do niewytłumaczalnych błędów. To jest rok, gdy AI przechodzi ze sfery cyfrowej do naszego rzeczywistego świata. Rozszerzenie zasięgu AI poza cyfrowe granice wymaga przemyślenia na nowo myślenia maszyn, łącząc cyfrową inteligencję AI z umiejętnościami mechanicznymi robotyki. Ta fuzja, którą nazywam "inteligencją fizyczną", umożliwia maszynom zrozumienie dynamicznych środowisk, radzenie sobie z nieprzewidywalnością i podejmowanie decyzji w czasie rzeczywistym. W przeciwieństwie do konwencjonalnych modeli AI, inteligencja fizyczna jest zakorzeniona w fizyce, uwzględniając fundamentalne zasady świata rzeczywistego, takie jak przyczyna i skutek. Takie cechy pozwalają modelom inteligencji fizycznej angażować się w różnorodne środowiska i adaptować się do nich. W mojej grupie badawczej na MIT opracowujemy modele inteligencji fizycznej, znane jako sieci płynne.
W jednym eksperymencie trenowaliśmy dwa drony—jeden z użyciem standardowego modelu AI, a drugi z użyciem sieci płynnej—do lokalizowania obiektów w lesie latem, wykorzystując dane od ludzkich pilotów. Choć oba drony świetnie sobie radziły przy zadaniach, do których zostały przeszkolone, tylko dron z sieci płynnej potrafił adaptować się do nowych warunków—jak zima czy środowiska miejskie. Ten eksperyment pokazał, że w przeciwieństwie do konwencjonalnych systemów AI, które przestają się uczyć po wstępnym szkoleniu, sieci płynne stale uczą się i przystosowują na podstawie doświadczeń, podobnie jak ludzie. Inteligencja fizyczna również interpretuje i realizuje złożone polecenia wywodzące się z tekstu lub obrazów, mostując instrukcje cyfrowe z działaniami w rzeczywistym świecie. Na przykład, stworzyliśmy system w naszym laboratorium, który jest w stanie zaprojektować i wydrukować w 3D małe roboty w mniej niż minutę na podstawie poleceń, takich jak "robot, który potrafi iść do przodu" czy "robot, który może chwytać obiekty. " Znaczące przełomy mają miejsce także w innych laboratoriach. Start-up robotyczny Covariant, kierowany przez badacza z UC Berkeley, Pietera Abbeela, tworzy chatboty podobne do ChatGPT, które mogą obsługiwać ramiona robotyczne. Firma zebrała ponad 222 milionów dolarów na rozwój i wdrażanie robotów sortujących w magazynach na całym świecie. Zespół z Carnegie Mellon University pokazał, że robot z jedną kamerą i nieprecyzyjną siłą napędową może wykonywać dynamiczne ruchy parkourowe—takie jak skakanie na przeszkody dwa razy wyższe niż on sam i pokonywanie luk dwa razy dłuższych, niż wynosi jego długość—używając sieci neuronowej trenowanej przez uczenie wzmocnione. Jeśli 2023 był rokiem tekst-do-obrazu, a 2024 rokiem tekst-do-wideo, to 2025 zapowiada się na rok inteligencji fizycznej. Ta nowa generacja urządzeń, która obejmuje nie tylko roboty, ale także systemy takie jak sieci energetyczne i inteligentne domy, będzie zdolna do interpretacji instrukcji i wykonywania zadań w świecie rzeczywistym.
Brief news summary
Sztuczna inteligencja (AI) poczyniła znaczne postępy w generowaniu tekstu, dźwięku i wideo, jednak jej zrozumienie świata fizycznego pozostaje ograniczone, co stwarza wyzwania dla praktycznych zastosowań. Dotyczy to szczególnie technologii takich jak samochody autonomiczne, które mogą napotkać nieoczekiwane błędy. Aby rozwiązać te problemy, pojawiła się koncepcja "inteligencji fizycznej". Podejście to łączy obliczeniowe możliwości AI z robotyką, umożliwiając systemom interakcję z otoczeniem poprzez zrozumienie przyczyn i skutków. Naukowcy z MIT są pionierami w tej dziedzinie, wprowadzając "sieci płynne", formę inteligencji fizycznej, która wykracza poza tradycyjną AI poprzez ciągłe uczenie się i adaptację poza początkowe programowanie. Ta innowacyjna metoda pozwala systemom wykonywać złożone zadania za pomocą prostych instrukcji cyfrowych. Na przykład laboratorium MIT stworzyło robota drukowanego w 3D, który może poruszać się naprzód przy użyciu podstawowych poleceń. Inne postępy obejmują robotyczne ramiona Covariant, sterowane przez chatboty, oraz roboty Carnegie Mellon, które korzystają z sieci neuronowych do dynamicznych ruchów. Postępy w inteligencji fizycznej sugerują, że do 2025 roku inteligentne systemy mogą stać się powszechne, zdolne do wykonywania zadań fizycznych na żądanie. Ten rozwój jest spodziewany w rozszerzeniu zasięgu AI poza środowiska cyfrowe, wpływając na takie dziedziny jak technologie inteligentnych domów i inne.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Hongkong korzysta z technologii blockchain: najwi…
HSBC uruchomił pierwszą w Hongkongu usługę rozliczeniową wykorzystującą technologię blockchain, zamieniając zwykłe depozyty bankowe na tokeny cyfrowe.

Tryb Sztucznej Inteligencji Google może być nieko…
W ubiegłym tygodniu Google ogłosił uruchomienie nowej funkcji wyszukiwania wspieranej przez sztuczną inteligencję o nazwie AI Mode.

Rozwiązanie Trójkąta Blockchain! Nieustanne poszu…
Od maja 2025 roku trilemma blockchainowa nadal stanowi podstawowe wyzwanie w sektorze kryptowalut i technologii blockchain.

Inwestycja Google w „model świata”: zbudowanie wa…
Na wydarzeniu Google I/O 2025 w Dolinie Krzemowej stało się jasne, że Google intensyfikuje swoje inicjatywy związane ze sztuczną inteligencją pod marką Gemini, obejmujące różnorodne architektury modeli i badania, szybko wdrażając innowacje do produktów.

Firma zajmująca się bezpieczeństwem blockchain op…
Firma zajmująca się bezpieczeństwem blockchainów, Dedaub, opublikowała raport pośmiertny dotyczący ataku na zdecentralizowaną giełdę Cetus, wskazując jako główną przyczynę exploit w parametrach płynności automatycznego market makera (AMM) Cetus, który obejścił kontrolę „przepełnienia” kodu.

Główny naukowiec ds. sztucznej inteligencji w Met…
Co łączą wszystkie istoty inteligentne? Według Yanna LeCuna, głównego naukowca ds.

Główne instytucje tradycyjnego sektora finansoweg…
Tokenizacja stanowi kluczowe zastosowanie technologii blockchain, przyciągając znaczące zainteresowanie i inwestycje ze strony sektora tradycyjnych finansów (TradFi).