lang icon English
Sept. 15, 2024, 12:46 a.m.
2457

ElasticDiffusion: Zlepšenie generovania obrázkov s AI na Rice University

Brief news summary

Generatívna umelá inteligencia, najmä difúzne modely, často čelí výzvam pri tvorbe konzistentných a detailných obrázkov, obzvlášť pri zachovaní jemných rysov ako je symetria tváre v neštvorcových formátoch. Vedci na Rice University vyvinuli nový prístup nazývaný ElasticDiffusion, ktorý predstavil doktorand Moayed Haji Ali na IEEE 2024 Conference on Computer Vision and Pattern Recognition v Seattli. Na rozdiel od predchádzajúcich modelov ako Stable Diffusion a DALL-E, ktoré dobre fungujú s štvorcovými obrázkami, ale trpia skreslením pri iných pomeroch strán, ElasticDiffusion vylepšuje generovanie obrázkov rozlišovaním miestnych pixelových detailov od globálnych tvarov. Tento pokrok minimalizuje chyby v neštvorcových obrázkoch a zaisťuje vizuálnu súdržnosť bez potreby ďalšieho tréningu. V súčasnosti ElasticDiffusion pracuje rýchlosťou, ktorá je 6-9 krát pomalšia ako konvenčné modely; výskumníci však optimalizujú jeho výkon, aby sa vyrovnal existujúcim metódam, umožňujúc jeho použitie v rôznych pomeroch strán.

Generatívna umelá inteligencia (AI), vrátane modelov ako Stable Diffusion, Midjourney a DALL-E, často zápasí s tvorbou konzistentných obrázkov, najmä pokiaľ ide o detaily ako symetria tváre a primerané znázornenie prstov. Tieto modely zvyčajne generujú štvorcové obrázky, čo vedie k problémom pri vytváraní obrázkov v rôznych pomeroch strán, čo má za následok anomálie ako dodatočné prsty alebo deformované tvary. Aby adresovali tieto problémy, počítačoví vedci na Rice University vyvinuli ElasticDiffusion, nový metódu využívajúcu predtrénované difúzne modely. Moayed Haji Ali, doktorand na Rice University, predstavil túto metódu na IEEE 2024 Conference on Computer Vision and Pattern Recognition v Seattli. Haji Ali vysvetlil, že tradičné difúzne modely dokážu generovať obrázky len v konkrétnom rozlíšení, čo je dôsledkom nadmerného prispôsobenia, pri ktorom AI modely dobre fungujú na známych dátach, ale majú problém s variáciami.

ElasticDiffusion zlepšuje tento prístup tým, že pri generovaní obrázkov oddeľuje lokálne a globálne informácie, namiesto ich kombinovania. Toto oddelenie pomáha predchádzať vizuálnym nedokonalostiam vyplývajúcim z opakujúcich sa dát pri prispôsobovaní sa neštvorcovým obrázkom. Haji Ali poznamenal, že tento proces zahŕňa najprv získanie globálneho skóre zachytávajúceho celkovú štruktúru obrázku a následne vyplnenie detailov na úrovni pixelov v sekciách. Táto metóda umožňuje generovanie jasnejších obrázkov v rôznych pomeroch strán bez potreby ďalšieho tréningu modelu. Aj keď ElasticDiffusion ponúka zlepšenú konzistenciu a prispôsobivosť pri generovaní obrázkov, má to jednu nevýhodu: v súčasnosti vyžaduje 6-9 krát viac času na vytvorenie obrázkov v porovnaní s konvenčnými difúznymi modelmi. Haji Ali má v pláne optimalizovať túto metódu, aby dosiahol ekvivalentné časy inferencie, zatiaľ čo zachová schopnosť generovať kvalitné obrázky bez ohľadu na pomer strán.


Watch video about

ElasticDiffusion: Zlepšenie generovania obrázkov s AI na Rice University

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 10, 2025, 1:40 p.m.

Optimizmus AI poháňa predaj polovodičov: 5 akcií …

Dopyt po polovodičoch sa stabilne zvyšuje, čo spôsobuje rast predaja a príjmov výrobcov čipov.

Nov. 10, 2025, 1:20 p.m.

AI Center na výstave SMM 2024 predstavuje inovatí…

V roku 2024 dosiahla výstava SMM v Hamburgu významný míľnik stanovením nových štandardov prostredníctvom spolupráce s umelou inteligenciou (UI).

Nov. 10, 2025, 1:20 p.m.

Top AI nástroje na posilnenie vašej SEO stratégie

V rýchlo sa vyvíjajúcom poli digitálneho marketingu si udržať konkurencieschopnosť vyžaduje prijatie najmodernejších technológií, pričom umelá inteligencia (AI) dnes hrá zásadnú úlohu, najmä v oblasti optimalizácie pre vyhľadávače (SEO).

Nov. 10, 2025, 1:18 p.m.

Dappier spolupracuje s News-Press & Gazette na um…

Dappier, začínajúci podnik zameraný na licencovanie dát pre umelú inteligenciu, oznámil nové partnerstvo so spoločnosťou News-Press & Gazette s cieľom rozšíriť prístup k kvalitnému spravodajskému obsahu pre aplikácie AI.

Nov. 10, 2025, 1:16 p.m.

Nástroje na zhrnutie videí s umelou inteligenciou…

Tvorcovia obsahu sa čoraz viac spoliehajú na nástroje na sumarizáciu videí využívajúce umelú inteligenciu (AI), aby efektívne kurátovali a zdieľali relevantný videobsah so svojím publikom.

Nov. 10, 2025, 1:13 p.m.

Prvý AI marketingový špecialista na svete, vedúci…

Marketingový priemysel zažíva transformačný moment s uvedením Head, považovaného za prvého skutočného AI marketéra na svete.

Nov. 10, 2025, 9:34 a.m.

Spravodajské videá generované umelou inteligencio…

V posledných rokoch rýchly pokrok v oblasti umelej inteligencie (UI) zmenil mnohé aspekty každodenného života, vrátane spôsobu, akým sa produkujú a konzumujú správy.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today