Google DeepMind, společnost zabývající se umělou inteligencí, integrovala verzi svého nejpokročilejšího velkého jazykového modelu (LLM) nazvaného Gemini do robotů. Tento model umožňuje strojům vykonávat různé úkoly, například „slam dunk“ s malým basketbalem skrz hoop na stolu, aniž by kdy viděly jiný robot provádět tuto akci, podle tvrzení firmy. Společnost je součástí širšího hnutí, které využívá pokrok v AI, který pohání chatovací roboty, k vývoji univerzálních robotů. Tento přístup však vyvolává obavy o bezpečnost kvůli potenciálu, že takové modely mohou generovat nepřesné a škodlivé výstupy. Cílem je navrhnout stroje, které jsou snadno ovladatelné a schopné vykonávat různé fyzické úkoly bez potřeby lidského dohledu nebo předprogramování. Spojením s robotickými modely Gemini mohou vývojáři vylepšit své roboty a umožnit jim chápat „přirozený jazyk a lépe porozumět fyzickému světu“, vysvětluje Carolina Parada, vedoucí týmu robotiky Google DeepMind se sídlem v Boulderu, Colorado. Model nazvaný Gemini Robotics, který byl odhalen 12.
března prostřednictvím blogového příspěvku a technického dokumentu, je podle Alexandra Khazatského, výzkumníka AI a spoluzakladatele CollectedAI v Berkeley, Kalifornie, zaměřeného na vytváření datových sad pro roboty řízené AI, popsán jako „malý, ale hmatatelný krok“ směrem k realizaci této vize. **Prostorové Vnímání** Tým v Londýně začal s modelem Gemini 2. 0, nejsofistikovanějším modelem vize a jazyka společnosti, který byl trénován analýzou obrovských množství dat pro rozpoznávání vzorů. Vyvinuli specializovanou verzi modelu přizpůsobenou pro úkoly vyžadující 3D fyzické a prostorové porozumění, jako je předpověď trajektorie objektů nebo rozpoznání stejné části objektu na snímcích pořízených z různých úhlů. Následně dále trénovali model pomocí dat z tisíců hodin skutečných, na dálku ovládaných demonstrací robotů. To umožnilo robotickému „mozku“ provádět skutečné akce, podobně jako LLM generují další slova na základě naučených asociací. Tým hodnotil Gemini Robotics na humanoidních robotech a robotických pažích, hodnotil jak trénované úkoly, tak nové aktivity. Podle jejich zjištění roboti využívající model konzistentně překonávali přední konkurenci v testech zahrnujících jak známé úkoly se změněnými detaily, tak zcela nové výzvy. **Skládání Origami**
Google DeepMind integruje model AI Gemini do robotiky.
Rádi bychom se dozvěděli více o tom, jak nedávné změny ve vyhledávání na internetu, podnícené nárůstem umělé inteligence, ovlivnily váš podnik.
Googleův Danny Sullivan poskytl radu SEO specialistům, kteří jednají s klienty dychtivými po aktualizacích strategií SEO v souvislosti s AI.
Uprostřed rychlého pokroku v technologiích umělé inteligence jsou globální dodavatelské řetězce pro klíčové komponenty pod stále větším tlakem, zejména v oblasti dodávek modulů AI čipů, nezbytných pro pohánění pokročilých aplikací AI.
iHeartMedia se spojila s Viant, aby představila programatickou reklamu napříč svými streamovacími audio službami, vysílacím rádiem a podcasty.
Nvidia nedávno oznámila výrazné rozšíření svých iniciativ v oblasti open source, což představuje významný milník v technologickém průmyslu.
Nárůst videí vytvářených umělou inteligencí zásadním způsobem mění sdílení obsahu na sociálních médiích.
Shrnutí a přepracování “The Gist” o transformaci AI a organizační kultuře Transformace AI představuje především kulturní výzvu, nikoli pouze technologickou
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today