Egy fémajtón San Francisco Mission negyedében a „π” szimbólum utal a belül zajló innovatív munkára. Ez a hely a Physical Intelligence (PI vagy π) nevű startupé, amely a robotok intelligenciájának javítását tűzte ki célul, és olyan befektetéseket vonzott, mint például a 400 millió dollár az OpenAI és Jeff Bezos részéről. A cég álma, hogy emberihez hasonló megértést és ügyességet ruház robotokra kiterjedt szenzor- és mozgásadatokkal, amelyeket AI-modellbe táplálnak. Belül intenzív a tevékenység: robotok pólókat hajtogatnak és tárgyakat mozgatnak, miközben egy férfi egy webkamerával felszerelt csipeszt kezel. A cég alapítói, köztük a vezérigazgató Karol Hausman, azt a jövőképet hirdetik, hogy az AI lehetővé teszi a robotok számára, hogy új feladatokhoz alkalmazkodjanak intuitív vezérléssel, a pontos programozás helyett. A ChatGPT-hez hasonló nagyméretű nyelvi modellek (LLM-ek) sikeréből merítve hiszik, hogy hasonló fejlesztések lehetségesek a robotikában is. Korábban az LLM-ek megmutatták, hogyan képesek nyílt végű feladatokat megoldani hagyományos programozás nélkül. Ezeket látási modellekkel kiegészítve a robotok korlátozott megértést kaptak környezetükről, lehetővé téve az informáltabb cselekvéseket. Egy nyilvános bemutatón kiemelték a potenciált, ahol a közönség robotot irányított kontinenseken át, bemutatva problémamegoldó képességét. A fizikai képességek javítása érdekében a Physical Intelligence más intézményekkel is együttműködik, adatok gyűjtésével különböző feladatokról, transzformer modellek használatával.
Ez a megközelítés ígéretes eredményeket mutat, rendkívüli jövőbeli robotképességeket előrevetítve, amelyek egy gyermek fejlődéséhez hasonlíthatók, a kezdeti kapaszkodástól egészen zongorajátékig, kiterjedt tanulás révén. Az emberi formájú robotok körüli izgalmak közepette, melyeket startupok és technológiai óriások fejlesztenek, néhány szakértő azonban szkeptikus a fizikai interakciók összetettségének leküzdhetőségét illetően. Felmerültek aggodalmak a felhajtás és a nagyszabású robotikai cselekvési adatok hiánya miatt, mivel a fizikai feladatok több változót foglalnak magukba, mint a nyelvfeldolgozás. Ennek ellenére az optimizmus fennmarad; lehet, hogy a routineurok emberi bemutatókból tanulnak, például YouTube videók megtekintésével, összefonva a virtuális és valóságos tanulást. A Physical Intelligence tervezi, hogy bővíti erőfeszítéseit, vállalatokkal együttműködve adatokat gyűjt különböző robotikai feladatokról. Egyéni hardvereket fejlesztenek ki, hogy esetlegesen közösségi alapú képzést hasznosítsanak hétköznapi feladatokkal. A startup legújabb fejleményei azt mutatják, hogy jelentős előrelépések történtek: robotok bonyolult háztartási feladatokat végeznek ügyességgel, amely szinte emberinek tűnik. LLM-ek és képalkotó modellek keverékének használatával a csapat általánosabb robotképességeket ért el, amelyek hasonlítanak az OpenAI korai modelljeire. Néhány szórakoztató hiba ellenére a csapat optimista. A "általános receptjük" a robottanulásra izgalmas előrelépést jelez, azt sugallva, hogy a fejlett AI integrálása a fizikai világban egyre életképesebbé válik.
A robotok intelligenciájának növelése: A fizikai intelligencia forradalmi megközelítése
A TechSmith Corporation, a vezető vállalat a vizuális kommunikációban, kiadta a 2024-es Videónéző Kutatását, amely egy átfogó jelentés a globális nézői elkötelezettségről és preferenciákról oktató- és információs videók esetében.
Syntrózis A mesterséges intelligencia (MI) átalakítja az értékesítési csapatokat Indiában, nemcsak a vezetőket, hanem az elsővonalbeli dolgozókat is fel empowerálva
2025 júniusában a Meta Platforms Inc.
A ByteDance kevesebb mint egy héttel ezelőtt kiadta a Seedance 2.0-t, ami világszerte felháborodást váltott ki művészek körében egy vírusvideóval, amelyben Tom Cruise-t és Brad Pittet látjuk harcolni, és amelyet mesterséges intelligencia generált.
Az irodai dolgozók ideális forgatókönyve az, hogy egyszerűen megnyomnak egy gombot egy eszközön, amely felveszi az értekezleteket, átírja a beszélgetéseket, és átalakítja azokat intézkedésre váró feladatokká.
A Microsoft hivatalosan is beépítette az AI-alapú Copilot segédet széles körben használt Office Csomagjába, ami jelentős lépést jelent a felhasználói interakciókban a produktivitási szoftverekkel.
A Seedance 2.0 egy élvonalbeli kép-ről-videóra és szöveg-ről-videóra modell, amelyet a ByteDance technológiai vállalat hozott létre.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today