A Google I/O 2025 bemutatja a Gemini AI Világmodellt és az Univezális Asszisztens Víziót

A Google I/O 2025-ös eseményén a szilícium-völgyi rendezvényházban egyértelművé vált, hogy a Google intenzívebben fejleszti AI-kezdeményezéseit a Gemini márka alatt, amely számos modellarchitektúrát és kutatást foglal magában, és gyorsan ülteti át az innovációkat termékekbe. Új funkciók mellett a Google merész jövőképet mutatott be: egy AI-központú operációs rendszer kidolgozását — nem egy hagyományos boot-élmény, hanem egy logikus szint, amelyhez minden alkalmazás hozzáférhet. Ez a „világséma” célja, hogy egy globális segéd képes legyen megérteni a fizikai világot, okoskodni és cselekedni a felhasználók nevében. Ez a stratégiai irány talán háttérbe szorult az esemény sok bejelentése mellett, de elengedhetetlen Google törekvéséhez, hogy lemaradjon a riválisokról. A Google milliárdokat fektet ebbe az elképzelésbe, miközben az a kihívás áll előttük, hogy gyorsabban fordítsák le AI-kutatásaikat termékekké, mint a versenytársaik, akik kiemelkednek az AI feldolgozásának egyszerűsítésében és kereskedelmi forgalomba hozhatóságában. Meg kell előzniük a Microsoft fókuszált stratégiáját, ellen kell állniuk az OpenAI hardver ambícióinak, és meg kell védeniük jövedelmező keresőüzletüket az AI-zavartól. A Google léptéke óriási: Sundar Pichai arról számolt be, hogy havi 480 trillió token feldolgozását végzik — ez az elmúlt évhez képest 50-szerese, és majdnem ötször akkora, mint a Microsoft mennyisége. A fejlesztői aktivitás is növekszik, több mint 7 millió felhasználó használja a Gemini API-t, ami ötszörös növekedést jelent az előző I/O óta, és a Vertex AI használata 40-szeres emelkedést mutat. Hatékonyság tekintetében fejlett modellek, mint a Gemini 2. 5 és az Ironwood TPU, javulnak. Új eszközök, mint az AI Mode és az AI Áttekintések, amelyek havi 1, 5 milliárd felhasználóhoz jutnak el, segítenek a kereső átformálásában AI-előszörivé. A Google egyik központi eleme a „világséma”, egy olyan AI, amely mélyen megérti a valódi világ dinamikáját, támogatva egy univerzális segédet, amely kizárólag a Google-ra támaszkodik. Ez feszültséget szít abban, hogy mennyit kívánnak kontrollálni: elsősorban meg akarnak védeni a 200 milliárd dolláros keresőüzletüket az AI-ba való integrálással, vagy nyíltan meg akarják osztani az alapvető AI-t külső fejlesztőkkel, akiket már több mint 20 millió fejlesztő alkot a közösségbe?A Google gyakran tartalékolja a kulcsfontosságú funkciókat a keresőbe, ugyanakkor egyre inkább nyit az fejlesztők felé, amit például a Project Mariner is szemléltet, melynek böngészőautomatizálási képességei hamarosan széleskörűen elérhetővé válnak a Gemini API-n keresztül, lehetőséget adva olyan riválisoknak, mint az Automation Anywhere vagy az UiPath, hogy építsenek erre. A jövőképet Demis Hassabis, a DeepMind vezérigazgatója fogalmazta meg, aki elmagyarázta, hogy a Google az általános mesterséges intelligencia (AGI) irányába húz. A Gemini, a legjobb multimodális modell, fejlődik a világsémává, rendszerként, amely szimulálja a világ alapelveit, mint az ok-okozati összefüggések és az intuitív fizika, hasonlóan az emberi tanuláshoz. A DeepMind munkája olyan modelleken például, mint a Genie 2, amelyek képesek interaktív játékvilágokat generálni szöveges vagy képes promptok alapján, ezt a megközelítést példázza. Hassabis már késő 2024 óta bővíti a világséma és az univerzális AI segéd koncepcióját, melyet Pichai és Josh Woodward, a Gemini vezetője is megerősítettek az I/O-n. A Gemini alkalmazás célja, hogy egy személyes, proaktív és erőteljes univerzális AI segéd legyen – ez egy kulcsfontosságú mérföldkő az AGI felé. Bemutatók, mint a Flow, ami egy filmkészítést segítő platform a Veo 3 fizikaérzékeny videó- és hangképességeivel, vagy a finomhangolt Gemini Robotics modell, mutatják, hogy a világséma megértése egyre inkább átjárja a kreatív és robotikai alkalmazásokat is. Pichai kiemelte a Project Astra integrációját, amely a live videó felismerést és képernyőmegosztást hozza be a Gemini Live-ba, ezzel az „univerzális segéd” fejlődésének része. Woodward pedig bemutatta, hogyan képes a személyes adatok, például a keresési előzmények vagy a Gmail/Naptár adatok révén a Gemini előre jelezni a felhasználók igényeit — például személyre szabott kvízeket vagy magyarázatokat —, megteremtve a jövőt, ahol a felhasználók „gondolatokká formálhatják” a dolgokat a Gemini 2. 5 Pro modellel. Fejlesztői eszközök, mint a Gemini 2. 5 Pro a „Deep Think” funkcióval, a hatékony 2. 5 Flash modell, amely hang- és URL alapú horgonyzással rendelkezik, valamint az előzetesen bemutatott Gemini Diffusion (amely a hagyományos Transformerek hatékonyságának felülmúlására utal), gazdagítják a Google eszköztárát. Az AI Studio, a Firebase Studio és a Vertex AI kiindulópontot nyújtanak a fejlesztők és vállalatok számára. Stratégiailag a Google nyomás alatt áll, hogy megvédje keresőmotorból származó bevételeit és felgyorsítsa az AI-alkalmazásokat, miközben erős versenytársaikkal kell megküzdenie. A Microsoft dominanciája az üzleti produktivitásban az Office 365 és a Copilot integrációjával nehezen megközelíthető. A Google előnye abban rejlik, hogy egy kiváló AI-gyökerekkel rendelkező felületet, egy univerzális segédet fejlesszen ki, amely egy új operációs rendszerként működik az ember és a technológia közötti interakcióban.
Pichai szerint a fizikai környezet tanulmányozása, például AR- szemüvegeken keresztül, lehet a következő nagy lépés. Ugyanakkor kihívások mellett állnak: olyan szabályozási veszélyek, mint az amerikai Igazságügyi Minisztérium antitröszt-vizsgálata, a Chrome eladása vagy az Európai Unió Digitális Piacok Rendelete (DMA), korlátozhatják a Google AI-hoz való hozzáférését. A gyors kivitelezés kulcsfontosságú, bár a legutóbbi haladások arra utalnak, hogy a Google gyorsít. Az iparág egészében akkor is nagy kihívásokkal szembesülnek, mint az Apple, akik mutatják, mennyire nehéz nagy léptékben áttérni az AI-ra. Ennek ellenére a Google stabilan szerzi meg az üzleti AI ügyfeleket, ami mögött jó stratégiai végrehajtás rejtőzik. A versenytársak egyidejűleg haladnak. A Microsoft az üzleti AI produktivitásra helyezi a hangsúlyt, eszközökkel, mint a Microsoft 365 Copilot és az Azure AI Foundry, és az „nyitott ügynökökre” alapuló web-stratégiát népszerűsít, hogy integrálja a különböző AI technológiákat. Az OpenAI vezet a fogyasztói elérésben, 600 millió havi felhasználóval a ChatGPT-hez képest, míg a Gemini 400 millióval rendelkezik. Tavaly indított kereső- és reklámoldalakat, melyek fenyegetik a Google keresődominanciáját. Az OpenAI jelentős befektetése egy potenciális hardver termékbe az Apple mobil áttöréséhez hasonlóan próbálja megbonyolítani a piacot, de az AI nyitottságának növekedése korlátozza ezeket a törekvéseket. Eközben a Google összetett ökoszisztémát működtet fejlesztői eszközök terén, és az Amazon is kihasználja előnyét a Bedrock segítségével, amely több AI modellt kínál vállalati ügyfelek számára. A vállalatok számára a Google világséma-alkotási víziója áttörést ígér, de stratégiai tervezést igényel. Gyorsan kell cselekedni, hogy elkerüljék a költséges utólagos fejlesztéseket, mivel az asszisztens-alapú felületek megjelennek. Az AI többmódú és AGI fejlesztésének kihasználása új innovációkat eredményezhet, de fel kell készülni a kommunikáció és az algoritmikus kölcsönhatás új paradigmájára való áttérésre. A vállalatoknak mérlegelniük kell a Google jövőképének hosszú távú, kockázattal járó természetét, valamint a biztonságosabb, azonnal hasznosítható megoldások iránti érdeklődést, például a Microsoft vagy az OpenAI által kínált hardver-AI keverékeket. A platformok közötti sokféleség kihasználása összhangban áll a nyílt ügynökök online elterjedő jövőjével. Ezek a döntések és a valós AI-bevezetési stratégiák a VentureBeat Transzform 2025 rendezvény központi témái lesznek, ahol vállalatvezetők és technológiai úttörők vitatják meg a platformválasztásokat és az AI megvalósítását. A helyek korlátozott száma miatt érdemes a korai regisztráció. Összességében a Google I/O egy ambiciózus erőfeszítést mutatott arra, hogy alakítsa az AI jövőjét, egy alapvető „világséma” és univerzális segéd felépítésével, amely a számítástechnika meghatározóvá tételét célozza. A technológiai ígéret hatalmas, de az végrehajtás és a időzítés kritikus kérdések: képes lesz-e a Google gyorsabban integrálni technológiáit, mint ahogy a riválisok megszilárdítják helyüket?Átalakíthatja-e a keresést, miközben navigál a szabályozási akadályokon, és mind az fogyasztóknak, mind a vállalkozásoknak kínál széleskörű terveket? A következő évek döntőek lesznek. A siker egy olyan környezeti, személyre szabott intelligencia korszakát hozhatja el, amely újjáalkotja az ember-számítógép kapcsolatot. A kudarc viszont Google-t egy figyelmeztető példává…— egy óriást, amely mindenbe bele fog, de a gyorsabb és élesebb fókuszú riválisok elnyomják.
Brief news summary
A Google I/O 2025-ön a Google bemutatta fejlett mesterséges intelligencia stratégiáját, amely a Gemini projektre és egy áttörő „világmodellre” összpontosít, mely egy univerzális AI-asszisztenst kíván létrehozni mély valós világ ismerettel és interakcióval. Ez az innováció arra törekszik, hogy egy új AI-korszak operációs rendszert alakítson ki—egy okos logikai réteget, amely az alkalmazásokba integrálva mindenhol jelen van—előnybe helyezve a Google-t más versenytársakkal, mint például a Microsoft vagy az OpenAI. Sundar Pichai, vezérigazgató hangsúlyozta, hogy több mint 7 millió fejlesztő használja a Gemini API-kat, míg Demis Hassabis a DeepMind-től kiemelte a mesterséges általános intelligencia (AGI) felé tett lépéseket. A kiállított innovációk közé tartozik a Flow filmkészítő eszköz és a robotikai modellek, amelyek a fejlett világmodell megértését demonstrálják. Bár jelentős előrelépések történtek, a Google kihívásokkal néz szembe, mivel meg kell találnia az egyensúlyt a fejlesztői nyitottság és a kontroll között, miközben a 200 milliárd dolláros kereső üzletágát fokozódó szabályozói nyomás alatt tartja. Riválisai, mint a Microsoft, az OpenAI és az Amazon gyors ütemben haladnak, növelve a verseny intenzitását. A Google kiterjedt AI-ökoszisztémája erőteljes eszközöket kínál, de bonyolultabbá teszi a felhasználók számára. A vállalatok számára az AI-vízió ígéretes átalakítást jelent, bár a siker attól függ, hogyan teljesít a világmodell azokkal a versenytársakkal szemben, akik gyorsabban vezetik be az új fejlesztéseket. Végül a gyors végrehajtás, a zökkenőmentes integráció és a szabályozási rugalmasság fogja eldönteni, hogy a Google vezeti-e az ambient intelligencia korszakát vagy elmarad-e ebben a döntő AI-versenyben, ami a globális digitális interakciót és computingot alakítja.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Hongkong belevág a blokkláncba: Európa legnagyobb…
Az HSBC Hongkong első olyan elszámolási szolgáltatást indított, amely blockchain technológiát alkalmaz, és a hagyományos banki letéteket digitális tokenekre alakítja át.

A Google 'AI módja' rossz lehet a Reddit számára
Múlt héten a Google bejelentette egy új, AI-alapú keresési funkció, az AI Mode elindítását.

A blokkchain-trilemmára adott válasz! A decentral…
2025 májusa óta a blokklánc trilemma továbbra is alapvető kihívás a kriptovaluta- és blokklánc szektorban.

A blockchain biztonsági cége közzéteszi a Cetus h…
A blockchain biztonsági céget, a Dedaub-ot közzétett egy utólagos jelentést a Cetus decentralizált csere hackeléséről, amelyben az okot egy a Cetus automata piaci készítő (AMM) likviditási paramétereinek kihasználásában jelölték meg, amely megkerülte a kód "túlfutás" ellenőrzését.

A Meta vezető AI-tudósa, Yann LeCun szerint a jel…
Mit osztanak meg minden intelligens lény? Yann LeCun, a Meta fő AI-tudósa szerint, négy kulcsfontosságú jellemző van.

Nagy hagyományos pénzügyi intézmények a tokenizác…
A tokenizáció a blokklánc-technológia egyik fő alkalmazási területe, amely jelentős érdeklődést és befektetést vonz a hagyományos pénzügyi (TradFi) szektortól.

Az MI kifejezetten a nők munkahelyeit váltja ki
Kevesebb mint három év alatt, amióta a tömegpiaci mesterséges intelligencia elérhetővé vált a fogyasztók számára, a mindennapi iparágak szinte kivétel nélkül ráugrottak a technológiára, olyan például, mintha antivaxxerok egy több szintű marketing rendszerhez donganának.