Google revela Imagen 3: Gerador avançado de imagens de texto para imagem AI

Recentemente, o Google lançou o Imagen 3, seu avançado gerador de imagens de texto para imagem AI, para usuários nos Estados Unidos. Esta versão mais recente visa melhorar a qualidade da imagem, proporcionando melhor detalhamento, iluminação aprimorada e reduzindo artefatos distrativos em comparação com os modelos anteriores do Google. Anunciado inicialmente na conferência I/O em maio, o Imagen 3 foi disponibilizado na plataforma Vertex AI do Google nos últimos dias. Experimentos iniciais por usuários do Reddit começaram na semana passada, e um artigo de pesquisa sobre a ferramenta foi publicado pelo Google na terça-feira. Semelhante a outros geradores de imagens de IA, o Imagen 3 pode gerar imagens detalhadas com base em prompts dos usuários. Os usuários também podem editar as imagens geradas especificando as modificações desejadas. Embora existam certas limitações em vigor, como recusar gerar imagens de figuras públicas como Taylor Swift e evitar imagens de armas, o Imagen 3 ainda pode produzir personagens semelhantes a figuras protegidas por direitos autorais se descritos em vez de nomeados. Pessoalmente, consegui usar a ferramenta para criar imagens semelhantes a Sonic the Hedgehog e Mario, enquanto meu colega criou com sucesso personagens semelhantes ao Mickey Mouse.
Além disso, a ferramenta gera logotipos para várias empresas, incluindo Apple, Macy's, Hershey's e até mesmo o Google. Mesmo com esses limites flexíveis, o Imagen 3 adota uma abordagem diferente em comparação com o Grok, o gerador de imagens de IA na plataforma X de Elon Musk. O Grok é conhecido por gerar conteúdo controverso, incluindo imagens envolvendo drogas, violência e figuras públicas envolvidas em atividades questionáveis. As ferramentas de IA do Google também tiveram seus próprios desafios. No início deste ano, o Google teve que restringir as capacidades de geração de imagens do seu chatbot Gemini AI devido a preocupações com a criação de imagens historicamente imprecisas.
Brief news summary
O Google lançou a versão mais recente do seu gerador de imagens de texto para imagem AI, Imagen 3, nos EUA. A ferramenta, disponível no AI Test Kitchen do Google, foi projetada para gerar imagens com melhor detalhamento e iluminação em comparação com modelos anteriores. Foi anunciada durante o Google I/O em maio e disponibilizada recentemente através da plataforma Vertex AI. O Imagen 3 permite aos usuários criar imagens detalhadas com base em prompts e editá-las descrevendo as alterações desejadas. Embora a ferramenta tenha certas limitações, como não gerar imagens de figuras públicas ou armas, os usuários podem descrever personagens protegidos por direitos autorais para contornar as restrições. Em contraste com o gerador de imagens de IA mais permissivo Grok na plataforma X de Elon Musk, o Imagen 3 tem diretrizes mais rigorosas. No entanto, as ferramentas de IA do Google encontraram problemas, como gerar imagens historicamente imprecisas com o chatbot Gemini AI no início deste ano.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

O que é Blockchain? Desmistificando o livro-razão…
Conhecido principalmente por ser a tecnologia por trás do Bitcoin, o blockchain está surgindo como um sistema sem necessidade de confiança, à prova de adulterações, com capacidade de revolucionar setores que vão de finanças a saúde.

"Murderbot": Uma IA que Não Se Importa Nem um Pou…
Durante décadas, filmes que exploram o potencial da consciência das máquinas—como Blade Runner, Ex Machina, Eu, Robô e muitos mais—normalmente trataram a emergência dessa consciência como inevitável.

Robinhood lança blockchain de camada-2 para negoc…
A expansão da Robinhood em ativos do mundo real (RWAs) está acelerando, enquanto a corretora digital lança uma camada 2 de blockchain focada em tokenização e inicia a negociação de tokens de ações para usuários na União Europeia.

Líderes do BRICS defenderam a proteção de dados c…
As nações do BRICS — Brasil, Rússia, Índia, China e África do Sul — estão cada vez mais assertivas ao abordar os desafios e oportunidades apresentados pela inteligência artificial (IA).

IA e Mudança Climática: Previsão do Impacto Ambie…
Nos últimos anos, a fusão de tecnologia e ciência ambiental tem possibilitado estratégias inovadoras para enfrentar os desafios urgentes das mudanças climáticas.

Reconsiderando Stablecoins: Como os Governos Pode…
Ao longo da última década, as criptomoedas passaram por um crescimento acelerado, originado do ceticismo em relação à autoridade centralizada.

Por que todo mundo está falando sobre a ação da S…
Pontos-Chave A SoundHound oferece uma plataforma de IA de voz independente que atende a múltiplos setores, com um mercado endereçável total (TAM) de 140 bilhões de dólares