lang icon English
Sept. 15, 2024, 12:46 a.m.
2621

ElasticDiffusion: Îmbunătățirea generării de imagini cu AI la Universitatea Rice

Brief news summary

Inteligența artificială generativă, în special modelele de difuzie, se confruntă adesea cu provocări în producerea de imagini consistente și detaliate, mai ales în menținerea trăsăturilor fine precum simetria facială în formate non-pătrate. Cercetătorii de la Universitatea Rice au dezvoltat o abordare inovatoare numită ElasticDiffusion, prezentată de studentul doctoral Moayed Haji Ali la Conferința IEEE 2024 privind Viziunea Computațională și Recunoașterea Pattern-urilor, desfășurată la Seattle. Spre deosebire de modelele anterioare precum Stable Diffusion și DALL-E, care performează bine cu imagini pătrate dar întâmpină dificultăți cu distorsiunile în alte raporturi de aspect, ElasticDiffusion îmbunătățește generarea de imagini prin distingerea detaliilor locale de pixel de formele globale. Această avansare minimizează erorile în imaginile non-pătrate menținând în același timp coerența vizuală, fără a necesita antrenament suplimentar. În prezent, ElasticDiffusion funcționează la o viteză de 6-9 ori mai mică decât modelele convenționale; cu toate acestea, cercetătorii optimizează performanța pentru a se alinia cu metodele existente, permițând utilizarea acesteia în diferite raporturi de aspect.

Inteligența artificială generativă (AI), incluzând modele precum Stable Diffusion, Midjourney și DALL-E, se confruntă adesea cu dificultăți în producerea de imagini consistente, mai ales în ceea ce privește detaliile precum simetria facială și reprezentarea corectă a degetelor. Aceste modele generează în general imagini pătrate, ceea ce duce la probleme atunci când sunt solicitate să creeze imagini în diferite raporturi de aspect, rezultând anomalii precum degete suplimentare sau forme distorsionate. Pentru a aborda aceste probleme, oamenii de știință de la Universitatea Rice au dezvoltat ElasticDiffusion, o metodă inovatoare ce utilizează modele de difuzie pre-antrenate. Moayed Haji Ali, un student doctoral la Rice, a prezentat această metodă la Conferința IEEE 2024 privind Viziunea Computațională și Recunoașterea Pattern-urilor, desfășurată la Seattle. Haji Ali a explicat că modelele tradiționale de difuzie pot genera imagini doar la o rezoluție specifică, aceasta fiind o consecință a overfitting-ului, unde un model AI performează bine pe date familiare, dar întâmpină dificultăți în fața variațiilor. ElasticDiffusion îmbunătățește abordarea prin separarea informațiilor locale de cele globale în timpul generării imaginii, în loc să le combine.

Această separare ajută la evitarea imperfecțiunilor vizuale care apar din date repetitive atunci când se adaptează la imagini non-pătrate. Haji Ali a menționat că procesul implică obținerea inițială a unui scor global care encapsulează structura generală a imaginii, urmată de completarea detaliilor la nivel de pixel în secțiuni. Această metodă permite generarea de imagini clare în diferite raporturi de aspect fără a necesita antrenarea suplimentară a modelului. Deși ElasticDiffusion oferă o consistență și adaptabilitate îmbunătățite în generarea de imagini, vine cu un compromis: în prezent necesită de 6-9 ori mai mult timp pentru a crea imagini comparativ cu modelele de difuzie convenționale. Haji Ali își propune să optimizeze metoda pentru a obține timpi de inferență echivalenți păstrând în același timp capacitatea de a genera imagini de înaltă calitate, indiferent de raportul de aspect.


Watch video about

ElasticDiffusion: Îmbunătățirea generării de imagini cu AI la Universitatea Rice

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 4, 2025, 1:37 p.m.

Autopilot-ul Tesla alimentat de inteligență artif…

Tesla a dezvăluit cea mai recentă actualizare a sistemului Autopilot, care include îmbunătățiri avansate bazate pe inteligență artificială, menite să crească semnificativ siguranța vehiculului și confortul la condus.

Dec. 4, 2025, 1:21 p.m.

Cum ar trebui directorii de marketing să prioriti…

Pe parcursul anului 2025, căutarea a evoluat rapid, pe măsură ce sistemele AI au devenit principalul mijloc de descoperire a informației, perturbând modelele tradiționale de trafic organic și reducând coerența și predictibilitatea acestora pentru multe branduri.

Dec. 4, 2025, 1:18 p.m.

Instrumente de moderare a conținutului video AI a…

În peisajul digital în rapidă creștere de astăzi, uneltele de inteligență artificială (IA) pentru moderarea conținutului video devin esențiale pentru îmbunătățirea siguranței online.

Dec. 4, 2025, 1:14 p.m.

Ce își imaginează liderii din marketing B2B și B2…

Peisajul de marketing din regiunea APAC evoluează rapid, iar progresele în domeniile experienței clienților (CX), personalizării și inteligenței artificiale (AI) creează atât provocări, cât și oportunități.

Dec. 4, 2025, 1:13 p.m.

Acțiunea Microsoft scade după ce a fost raportată…

Raportările recente, care au făcut headline-uri importante în ultima vreme, indică faptul că Microsoft își reduce cotele de vânzare pentru software-ul AI, ceea ce este destul de intrigant.

Dec. 4, 2025, 1:12 p.m.

Panel SMM alimentat de AI „AI SMM Panel” oferă se…

Panelul AI SMM s-a poziționat ca un furnizor de top în industria marketingului pe rețelele sociale (SMM), oferind o experiență excepțională utilizatorilor în căutare de servicii SMM accesibile și eficiente.

Dec. 4, 2025, 9:41 a.m.

Cum să-ți faci SaaS-ul recomandat de platformele …

Chat-ul AI este acum cel mai utilizat instrument de către cumpărătorii B2B pentru a-și face o listă scurtă de software — depășind site-urile de recenzii, site-urile vendorilor și oameni de vânzări.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today