La intel·ligència artificial generativa (IA), incloent-hi models com Stable Diffusion, Midjourney i DALL-E, sovint té dificultats per produir imatges consistents, especialment quan es tracta de detalls com la simetria facial i la representació adequada dels dits. Aquests models generalment generen imatges quadrades, el que porta a problemes quan se'ls demana crear imatges en diferents proporcions, resultant en anomalies com dits extra o formes distorsionades. Per abordar aquests problemes, científics informàtics de la Universitat Rice han desenvolupat ElasticDiffusion, un mètode nou que utilitza models de difusió preentrenats. Moayed Haji Ali, un estudiant de doctorat a Rice, va presentar aquest mètode a la Conferència IEEE 2024 sobre Visió Computacional i Reconeixement de Patrons a Seattle. Haji Ali va explicar que els models de difusió tradicionals només poden generar imatges amb una resolució específica, cosa que és una conseqüència del sobreajustament, on un model d'IA funciona bé amb dades familiars però té dificultats amb variacions. ElasticDiffusion millora l’enfocament separant la informació local i global durant la generació d’imatges, en lloc de combinar-les.
Aquesta separació ajuda a evitar imperfeccions visuals que sorgeixen de dades repetitives quan s’adapten a imatges no quadrades. Haji Ali va assenyalar que el procés implica obtenir inicialment una puntuació global que encapsula l’estructura general de la imatge, seguida de completar els detalls a nivell de píxel en seccions. Aquest mètode permet generar imatges més clares a través de diverses proporcions sense necessitat de formació addicional del model. Tot i que ElasticDiffusion ofereix una millor coherència i adaptabilitat en la generació d’imatges, comporta un compromís: actualment requereix entre 6 i 9 vegades més temps per crear imatges en comparació amb els models de difusió convencionals. Haji Ali té l'objectiu d'optimitzar el mètode per aconseguir temps d'inferència equivalents mantenint la capacitat de generar imatges d’alta qualitat independentment de la proporció.
ElasticDiffusion: Millora de la Generació d’Imatges amb IA a la Universitat Rice
Coca-Cola, fa anys celebrada per la seva icònica publicitat de Nadal, ha rebut una resposta negativa significativa amb la seva campanya nadalenca de 2025 que incorpora en gran mesura la intel·ligència artificial generativa.
SMM Pilot és una plataforma avançada de creixement basada en IA que està transformant la manera com les petites i mitjanes empreses (PIME) en comerç electrònic i màrqueting d'afiliats milloren la seva presència a les xarxes socials i les seves estratègies de màrqueting digital.
L'IA està passant de ser un concepte prometedor a una part integral de les operacions de màrqueting.
Kling AI, creat per l'empresa tecnològica xinesa Kuaishou i llançada al juny de 2024, és un avanç significatiu en la creació de contingut generat per intel·ligència artificial, especialitzant-se en convertir textos en llengua natural en vídeos de gran qualitat.
La intel·ligència artificial està reconfigurant fonamentalment el camp de l’analítica SEO, inaugurant una nova era de estratègies de màrqueting basades en les dades.
CoreWeave, un dels principals proveïdors d'infraestructura d'Intel·ligència Artificial, ha experimentat una important pujada en la seva valoració mentre s'expandeix dins del sector d'IA, que creix de forma ràpida.
En els darrers anys, la intel·ligència artificial (IA) ha transformat moltes indústries, especialment la publicitat, permetent la creació àgil i a gran escala de contingut.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today