lang icon English
Sept. 15, 2024, 12:46 a.m.
2467

ElasticDiffusion: Millora de la Generació d’Imatges amb IA a la Universitat Rice

Brief news summary

La intel·ligència artificial generativa, especialment els models de difusió, sovint s’enfronta a reptes per produir imatges consistents i detallades, especialment en mantenir característiques fines com la simetria facial en formats no quadrats. Investigadors de la Universitat Rice han desenvolupat un nou enfocament anomenat ElasticDiffusion, presentat per l’estudiant de doctorat Moayed Haji Ali a la Conferència IEEE 2024 sobre Visió Computacional i Reconeixement de Patrons a Seattle. A diferència dels models anteriors com Stable Diffusion i DALL-E, que funcionen bé amb imatges quadrades però tenen dificultats amb la distorsió en altres proporcions, ElasticDiffusion millora la generació d’imatges distingint els detalls de píxels locals de les formes globals. Aquest avançament minimitza errors en imatges no quadrades mentre assegura la coherència visual, sense la necessitat d’una formació addicional. Actualment, ElasticDiffusion opera a una velocitat que és de 6 a 9 vegades més lenta que els models convencionals; no obstant això, els investigadors estan optimitzant el seu rendiment per alinear-lo amb els mètodes existents, permetent el seu ús a través de diverses proporcions.

La intel·ligència artificial generativa (IA), incloent-hi models com Stable Diffusion, Midjourney i DALL-E, sovint té dificultats per produir imatges consistents, especialment quan es tracta de detalls com la simetria facial i la representació adequada dels dits. Aquests models generalment generen imatges quadrades, el que porta a problemes quan se'ls demana crear imatges en diferents proporcions, resultant en anomalies com dits extra o formes distorsionades. Per abordar aquests problemes, científics informàtics de la Universitat Rice han desenvolupat ElasticDiffusion, un mètode nou que utilitza models de difusió preentrenats. Moayed Haji Ali, un estudiant de doctorat a Rice, va presentar aquest mètode a la Conferència IEEE 2024 sobre Visió Computacional i Reconeixement de Patrons a Seattle. Haji Ali va explicar que els models de difusió tradicionals només poden generar imatges amb una resolució específica, cosa que és una conseqüència del sobreajustament, on un model d'IA funciona bé amb dades familiars però té dificultats amb variacions. ElasticDiffusion millora l’enfocament separant la informació local i global durant la generació d’imatges, en lloc de combinar-les.

Aquesta separació ajuda a evitar imperfeccions visuals que sorgeixen de dades repetitives quan s’adapten a imatges no quadrades. Haji Ali va assenyalar que el procés implica obtenir inicialment una puntuació global que encapsula l’estructura general de la imatge, seguida de completar els detalls a nivell de píxel en seccions. Aquest mètode permet generar imatges més clares a través de diverses proporcions sense necessitat de formació addicional del model. Tot i que ElasticDiffusion ofereix una millor coherència i adaptabilitat en la generació d’imatges, comporta un compromís: actualment requereix entre 6 i 9 vegades més temps per crear imatges en comparació amb els models de difusió convencionals. Haji Ali té l'objectiu d'optimitzar el mètode per aconseguir temps d'inferència equivalents mantenint la capacitat de generar imatges d’alta qualitat independentment de la proporció.


Watch video about

ElasticDiffusion: Millora de la Generació d’Imatges amb IA a la Universitat Rice

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 12, 2025, 1:31 p.m.

L'anunci de festes amb IA de Coca-Cola provoca un…

Coca-Cola, fa anys celebrada per la seva icònica publicitat de Nadal, ha rebut una resposta negativa significativa amb la seva campanya nadalenca de 2025 que incorpora en gran mesura la intel·ligència artificial generativa.

Nov. 12, 2025, 1:26 p.m.

El pilot d'SMM ofereix una plataforma de creixeme…

SMM Pilot és una plataforma avançada de creixement basada en IA que està transformant la manera com les petites i mitjanes empreses (PIME) en comerç electrònic i màrqueting d'afiliats milloren la seva presència a les xarxes socials i les seves estratègies de màrqueting digital.

Nov. 12, 2025, 1:23 p.m.

3 Maneres que els CMOs poden utilitzar la IA per …

L'IA està passant de ser un concepte prometedor a una part integral de les operacions de màrqueting.

Nov. 12, 2025, 1:18 p.m.

Kling AI: El model xinès de text a vídeo

Kling AI, creat per l'empresa tecnològica xinesa Kuaishou i llançada al juny de 2024, és un avanç significatiu en la creació de contingut generat per intel·ligència artificial, especialitzant-se en convertir textos en llengua natural en vídeos de gran qualitat.

Nov. 12, 2025, 1:17 p.m.

Anàlisi SEO millorada per IA: desbloquejant visio…

La intel·ligència artificial està reconfigurant fonamentalment el camp de l’analítica SEO, inaugurant una nova era de estratègies de màrqueting basades en les dades.

Nov. 12, 2025, 1:11 p.m.

La valoració de CoreWeave augmenta considerableme…

CoreWeave, un dels principals proveïdors d'infraestructura d'Intel·ligència Artificial, ha experimentat una important pujada en la seva valoració mentre s'expandeix dins del sector d'IA, que creix de forma ràpida.

Nov. 12, 2025, 9:24 a.m.

Els humans tornen al màrqueting?

En els darrers anys, la intel·ligència artificial (IA) ha transformat moltes indústries, especialment la publicitat, permetent la creació àgil i a gran escala de contingut.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today