Google представя Imagen 3: Усъвършенстван AI текст-към-изображение генератор

Google наскоро пусна Imagen 3, своя усъвършенстван AI текст-към-изображение генератор, за потребители в Съединените щати. Тази последна версия има за цел да подобри качеството на изображенията, като осигурява по-добри детайли, подобрено осветление и намалява разсейващите артефакти в сравнение с предишните модели на Google. Първоначално обявен на конференцията I/O през май, Imagen 3 беше направен достъпен на платформата Vertex AI на Google през последните дни. Ранни експерименти от потребители на Reddit започнаха миналата седмица, а научна статия за инструмента беше публикувана от Google във вторник. Подобно на други AI генератори на изображения, Imagen 3 може да генерира детайлни изображения въз основа на указания от потребителите. Потребителите могат също така да редактират генерираните изображения, като посочват желаните модификации. Има обаче определени ограничения, като отказ да генерира изображения на публични личности като Тейлър Суифт и избягване на изображения на оръжия, но Imagen 3 все пак може да създава герои, наподобяващи запазени авторски права фигури, ако са описани, а не назовани. Лично аз бях в състояние да използвам инструмента, за да създам изображения, наподобяващи Соник и Марио, докато моят колега успешно създаде герои, наподобяващи Мики Маус.
Освен това, инструментът генерира логотипи на различни компании, включително Apple, Macy's, Hershey's и дори Google. Дори с тези гъвкави граници, Imagen 3 подхожда по различен начин в сравнение с Grok, AI генератора на изображения на платформата X на Илон Мъск. Известно е, че Grok генерира спорно съдържание, включително изображения, свързани с наркотици, насилие и публични личности, ангажирани в съмнителни дейности. AI инструментите на Google също са имали своите собствени предизвикателства. По-рано тази година Google трябваше да ограничи възможностите за генериране на изображения на своя AI чатбот Gemini поради опасения за исторически неточно създаване на изображения.
Brief news summary
Google пусна последната версия на своя AI текст-към-изображение генератор, Imagen 3, в САЩ. Инструментът, наличен на AI Test Kitchen на Google, е предназначен да генерира изображения с по-добри детайли и осветление в сравнение с предишните модели. Той беше обявен по време на Google I/O през май и наскоро направен общодостъпен чрез платформата Vertex AI. Imagen 3 позволява на потребителите да създават детайлни изображения въз основа на указания и да ги редактират, като описват желаните промени. Въпреки че инструментът има определени ограничения, като генериране на изображения на публични личности или оръжия, потребителите могат да описват запазени авторски права герои, за да заобиколят ограниченията. В контраст с по-разрешителния AI генератор на изображения Grok на платформата X на Илон Мъск, Imagen 3 има по-стриктни насоки. Независимо от това, AI инструментите на Google са срещали проблеми, като генериране на исторически неточни изображения със своя AI чатбот Gemini по-рано тази година.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Крипто възходи и падания: Когато музикалните изпъ…
Криптовалутите обещаха да революционизират музикалната индустрия.

Определено ще построим бункер преди да пуснем AGI
OpenAI, първоначално възхваляван за мисията си да разработи изкуствена general интелигентност (AGI) за широка полза на човечеството, в момента е замесен във вътрешни конфликти и променяща се стратегическа фокусировка, които провокират дебати в технологичните и етичните кръгове.

Комисарят на CFTC Мерсінгер ще бъде главен изпълн…
Лятна Мерсинджър, републикански комисар в Комисията за търговия с фючърси на стоки (CFTC), ще стане следващият главен изпълнителен директор на Асоциацията на блокчейн, потвърди високопоставен служител на организацията в сряда.

Бясната надпревара на Intel за втора позиция и кр…
Тази седмица обзорът на технологичните новини акцентира върху значимите глобални развития, формиращи сектора на полупроводниците и технологиите, движени от променящи се политики, пазарни цели и регионални тенденции на растеж.

Практици: Проникновена иновация слива смъртта и д…
Наградите за иновативни юристи на FT за 2025 г.

Гугъл достига 150 милиона потребители за абонамен…
Услугата за абонамент Google One на компанията Alphabet постигна забележителен растеж, достигайки 150 милиона абонати — увеличение с 50% от февруари 2024 г.

Блокчейн в недвижимите имоти: опростяване на тран…
Индустрията на недвижимите имоти все по-често възприема блокчейн технологиите като трансформативен инструмент за опростяване на транзакциите и подобряване на управлението на собствеността.