Google I/O 2025 представляет модель мира Gemini AI и видение универсального помощника

На мероприятии Google I/O 2025 в Кремниевой долине стало очевидно, что Google усиливает свои инициативы в области ИИ под брендом Gemini, который включает разнообразные архитектуры моделей и исследования, быстро внедряя инновации в продукты. Помимо новых функций, Google озвучила смелое видение: создание операционной системы, ориентированной на ИИ — не традиционной системы запуска, а логического слоя, доступного для любого приложения. Эта «модель мира» должна стать основой для универсального ассистента, понимающего физический мир, осуществляющего рассуждения и действия от имени пользователей. Такой стратегический подход, возможно, был затенен многочисленными анонсами мероприятия, но является ключевым для амбиций Google опередить конкурентов. Google инвестирует миллиарды в этот «лунный проект», сталкиваясь с задачей быстрее превращать свои исследовательские разработки в продукты по сравнению с конкурентами, которые отлично умеют внедрять ИИ в доступные и коммерчески выгодные решения. Ему нужно перехитрить стратегию Microsoft, противостоять амбициям OpenAI по аппаратному обеспечению и защищать свою прибыльную поисковую империю на фоне разрушения ИИ. Масштаб Google безмерен: Сундар Пичаи отметил, что в месяц обрабатывается 480 триллионов токенов — в 50 раз больше по сравнению с прошлым годом и почти в пять раз больше объёмов Microsoft. Вовлеченность разработчиков растёт: уже более 7 миллионов используют API Gemini, что в пять раз больше, чем на прошлой I/O, а использование Vertex AI увеличилось в 40 раз. Производительность улучшается благодаря передовым моделям, таким как Gemini 2. 5 и Ironwood TPU. Новые инструменты, такие как AI Mode и AI Overviews, с 1, 5 миллиардами пользователей ежемесячно, помогают сделать переход поиска в AI-первую среду более плавным. В центре видения Google — «модель мира», ИИ, который глубоко понимает динамику реального мира, поддерживая универсального помощника, полностью основанного на технологиях Google. Возникает напряжение по поводу того, сколько контроля хочет сохранить Google: следует ли защищать свой $200-миллиардный бизнес поиска, интегрируя ИИ внутри компании, или делиться фундаментальными ИИ-технологиями с внешними разработчиками — экосистемой, включающей уже более 20 миллионов участников?Хотя Google традиционно держит ключевые функции для поиска, всё больше предоставляет доступ разработчикам, что видно на примере Project Mariner, который скоро получит расширение через API Gemini, давая конкурентам, таким как Automation Anywhere и UiPath, возможность строить на его базе. Это видение озвучил Демис Хассабис, CEO DeepMind, подчеркнув, что Google удваивает свои усилия по созданию искусственного общего интеллекта (AGI). Gemini, лучший мультимодальный модел, постепенно превращается в «модель мира» — систему, моделирующую принципы реальности, такие как причинно-следственные связи и интуитивную физику, подобно человеческому обучению. Проекты DeepMind, например Genie 2 — способный создавать интерактивные игровые среды по текстовым или визуальным подсказкам — демонстрируют этот подход. Хассабис продолжает расширять идеи о модели мира и универсального ИИ-ассистента с конца 2024 года, а Пичаи и руководитель Gemini Джош Вудворд подтверждают это на I/O. Приложение Gemini стремится стать личным, проактивным и мощным универсальным ИИ-ассистентом, что является важной вехой на пути к AGI. Демонстрации, такие как Flow — платформа для кинопроизводства с физически осознанным видео и аудио Veo 3 — и точная настройка модели Gemini Robotics, показывают, что понимание модели мира уже входит в области творчества и робототехники. Пичаи отметил интеграцию Project Astra в Gemini Live — возможность работы с живым видео и совместным доступом к экрану как части развития «универсального ассистента». Вудворд продемонстрировал, как личные контексты, такие как история поиска и скоро Gmail/Календарь, позволяют Gemini предвидеть потребности пользователя — например, создавать индивидуальные викторины или объяснения — задавая основу для будущего, где пользователь сможет «мысленно воплотить идею в реальность» с помощью модели Gemini 2. 5 Pro. Инструменты для разработчиков, такие как Gemini 2. 5 Pro с функцией «Deep Think», — эффективная модель 2. 5 Flash с возможностью обработки аудио и URL, и предварительная версия Gemini Diffusion (что говорит о желании выйти за рамки простых трансформеров ради повышения эффективности), расширяют арсенал Google. AI Studio, Firebase Studio и Vertex AI служат платформами для разработчиков и предприятий. Стратегически Google сталкивается с необходимостью защищать доходы от поисковых запросов и ускорять внедрение ИИ в условиях жесткой конкуренции. Доминирование Microsoft в корпоративной продуктивности, с помощью Office 365 и Copilot, трудно превзойти. Важным преимуществом Google может стать создание более продвинутого интерфейса на базе ИИ — универсального помощника, функционирующего как новая операционная система для взаимодействия человека и технологий.
Пичаи высказал предположение, что следующий прорыв — осознание физической среды, возможно, через AR-очки. Тем не менее, остаются вызовы: регулятивные угрозы, такие как антимонопольное расследование со стороны Минюста США, возможное разделение Chrome и нормативы Европейского Союза, могут ограничить возможности Google в области ИИ. Скорость реализации решений критична, хотя последние успехи показывают, что Google ускоряет процесс. В целом, индустрия сталкивается с трудностями масштабного перехода к ИИ на примере таких гигантов, как Apple. Но устойчивое приобретение корпоративных клиентов для ИИ говорит о хорошем качестве внутренней реализации. Конкуренты тоже развиваются одновременно. Microsoft делает ставку на корпоративную продуктивность с помощью инструментов, как Microsoft 365 Copilot и Azure AI Foundry, а также выступает за стратегию «открытого агентивного интернета», объединяющего разные ИИ-технологии. OpenAI лидирует по пользовательской аудитории — около 600 миллионов в месяц через ChatGPT, против 400 миллионов в Gemini. Недавно запустила поиск и планирует показывать рекламу, что угрожает доминированию Google в поиске. Значительные инвестиции OpenAI в аппаратные проекты, задуманые как революционные, похожи на прорыв Apple в мобильной технике, но сталкиваются с ограничениями растущей открытости ИИ. Тем временем Google управляет сложной экосистемой инструментов для разработчиков, балансируя между различными потребностями, а Amazon продвигает свою платформу Bedrock, предлагая предприятиям множество моделей ИИ. Для компаний видение модели мира Google обещает революцию, но требует стратегического подхода. Быстрые действия помогут избежать дорогостоящих переделок, когда интерфейсы на базе помощи станут стандартом. Использование прогресса Google в мультимодальности и развитии AGI может привести к новаторским решениям, но это требует подготовленности к новой парадигме взаимодействия — API и агентному управлению. Бизнесу нужно взвесить долгосрочные риски и перспективы видения Google с более практическими вариантами от Microsoft или OpenAI, которые активно развивают аппаратные и AI-решения. Стратегия диверсификации и интеграции усилий across платформы соответствуют развитию открытого агентивного интернета. Эти ключевые решения и стратегии внедрения ИИ в реальной среде станут центральной темой мероприятия VentureBeat Transform 2025, собравших лидеров бизнеса и технологических инновационщиков для обсуждения выбора платформ и реализации ИИ. Рекомендуется регистрироваться заранее, так как места ограничены. В целом I/O от Google показала масштабное стремление формировать будущее ИИ, создавая базовую «модель мира» и универсального помощника, чтобы переопределить сферу вычислений и укрепить свои позиции. Технологический потенциал огромен, но вопросы реализации и сроков остаются критическими: сможет ли Google быстрее внедрить свои технологии, чем конкуренты, закрепившись в пространстве?Смогут ли они преобразовать поиск, справляясь с регуляциями и обслуживая потребителей и бизнес с широкой программой? Будущее dependence от решений в ближайшие годы станет решающим для определения лидера. Успех может привести к эпохе окружающего, персонализированного интеллекта, переосмысливающего взаимодействие человека с компьютерами. Неудача рискует оставить Google примером амбиций, которые слишком много обещали, но были опередены более ловкими и быстрыми конкурентами.
Brief news summary
На конференции Google I/O 2025 компания представила свою передовую стратегию искусственного интеллекта, сосредоточенную вокруг проекта Gemini и революционной "модели мира", предназначенной для создания универсального помощника с глубоким пониманием реального мира и возможностью взаимодействия с ним. Эта инновация направлена на создание новой операционной системы эпохи ИИ — интеллектуального логического слоя, интегрированного во все приложения, что позволяет Google опередить конкурентов, таких как Microsoft и OpenAI. Генеральный директор Сундар Пичаи отметил, что более 7 миллионов разработчиков используют API Gemini, а Демис Хассабис из DeepMind подчеркнул прогресс в направлении искусственного общего интеллекта (AGI). В числе продемонстрированных инноваций — инструмент для кинотворчества Flow и модели роботов, показывающие продвинутое понимание модели мира. Несмотря на значительные достижения, Google сталкивается с задачами балансирования между открытостью для разработчиков и контролем над своей поисковой бизнес-империей стоимостью в 200 миллиардов долларов на фоне усиливающегося нормативного давления. Конкуренты, такие как Microsoft, OpenAI и Amazon, быстро развиваются, что усиливает конкурентную борьбу. Расширенная экосистема ИИ Google предоставляет мощные инструменты, но усложняет использование для пользователей. Для предприятий видение Google в области ИИ обещает трансформацию, однако успех во многом зависит от эффективности модели мира и способности быстро реагировать на действия более быстрых конкурентов. В конечном итоге, определяющими факторами станут скорость реализации, бесшовная интеграция и адаптивность к регуляторным требованиям — только так Google сможет сохранить лидерство в эпоху окружающего интеллекта или окажется позади в важнейшей гонке ИИ, формирующей глобальную цифровую коммуникацию и вычислительные технологии.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Гонконг внедряет блокчейн: крупнейший банк Европы…
HSBC запустил первую в Гонконге службу расчетов на базе блокчейн-технологии, превращая обычные банковские депозиты в цифровые токены.

Режим ИИ от Google может навредить Reddit
На прошлой неделе Google объявила о запуске новой функции поиска, основанной на искусственном интеллекте, под названием AI Mode.

Ответ на блокчейн-трилемму! Бесконечный поиск дец…
К May 2025 года треугольник блокчейна остается фундаментальной проблемой в криптовалютной и блокчейн-отрасли.

Компания, специализирующаяся на безопасности блок…
Компания по безопасности блокчейна Dedaub опубликовала отчет о постмортеме хакерской атаки на децентрализованную биржу Cetus, указав первопричиной уязвимость в параметрах ликвидности автоматического маркет-мейкера (AMM) Cetus, которая обошла проверку на «переполнение» кода.

Главный специалист по искусственному интеллекту к…
Что объединяет всех разумных существ? По словам Яна Лекуна, ведущего специалиста по искусственному интеллекту в Meta, существуют четыре ключевых признака.

Крупные учреждения традиционного финансового сект…
Токенизация является одним из ключевых приложений технологии блокчейн, привлекая значительный интерес и инвестиции со стороны традиционного финансового сектора (TradFi).

Искусственный интеллект специально заменяет женск…
За менее чем три года после того, как массовый искусственный интеллект стал доступен потребителям, предприятия практически во всех отраслях поспешили внедрить эту технологию, подобно антипрививочникам, притягиваемым многоуровневыми маркетинговыми схемами.