lang icon En
Sept. 15, 2024, 12:46 a.m.
2751

ElasticDiffusion: Poboljšanje Generisanja Slika uz AI na Univerzitetu Rajs

Brief news summary

Generativna veštačka inteligencija, posebno difuzni modeli, često se suočava s izazovima u proizvodnji konzistentnih i detaljnih slika, posebno kada je reč o održavanju finih karakteristika poput simetrije lica u nekvadratnim formatima. Istraživači na Univerzitetu Rajs razvili su novi pristup nazvan ElasticDiffusion, koji je predstavio doktorand Moajed Hadži Ali na IEEE 2024 konferenciji o kompjuterskoj viziji i prepoznavanju obrazaca u Sijetlu. Za razliku od ranijih modela kao što su Stable Diffusion i DALL-E, koji dobro funkcionišu sa kvadratnim slikama ali se muče sa izobličenjima u drugim odnosima stranica, ElasticDiffusion poboljšava generisanje slika razdvajanjem lokalnih pikselnih detalja od globalnih oblika. Ovo unapređenje minimizira greške u nekvadratnim slikama dok osigurava vizuelnu koherentnost, bez potrebe za dodatnim treningom. Trenutno, ElasticDiffusion radi brzinom koja je 6-9 puta sporija od konvencionalnih modela; međutim, istraživači optimizuju njegovu performansu kako bi je uskladili sa postojećim metodama, omogućavajući njeno korišćenje u različitim odnosima stranica.

Generativna veštačka inteligencija (AI), uključujući modele kao što su Stable Diffusion, Midjourney i DALL-E, često se suočava s izazovima u proizvodnji konzistentnih slika, posebno kada je reč o detaljima poput simetrije lica i prikaza prstiju. Ovi modeli generalno generišu kvadratne slike, što dovodi do problema kada je zadatak kreiranje slika u različitim odnosima stranica, rezultirajući anomalijama poput dodatnih prstiju ili izobličenih oblika. Kako bi rešili ove probleme, kompjuterski naučnici na Univerzitetu Rajs razvili su ElasticDiffusion, novu metodu koja koristi unapred trenirane difuzne modele. Moajed Hadži Ali, doktorand na Rajsu, prezentovao je ovu metodu na IEEE 2024 konferenciji o kompjuterskoj viziji i prepoznavanju obrazaca u Sijetlu. Hadži Ali je objasnio da tradicionalni difuzni modeli mogu generisati slike samo na određenoj rezoluciji, što je posledica prenaučenosti, gde AI model dobro radi sa poznatim podacima, ali se muči sa varijacijama. ElasticDiffusion poboljšava pristup razdvajanjem lokalnih i globalnih informacija tokom generisanja slike, umesto da ih kombinuje.

Ovo razdvajanje pomaže da se izbegnu vizuelne nesavršenosti koje nastaju zbog ponavljajućih podataka prilikom adaptacije na nekvadratne slike. Hadži Ali je napomenuo da proces uključuje inicijalno dobijanje globalnog skora koji obuhvata celokupnu strukturu slike, nakon čega se popunjavaju pikselni detalji po segmentima. Ova metoda omogućava generisanje jasnijih slika u različitim odnosima stranica, bez potrebe za dodatnim treniranjem modela. Iako ElasticDiffusion nudi poboljšanu konzistentnost i prilagodljivost u generisanju slika, postoji i kompromis: trenutno zahteva 6-9 puta duže vreme za kreiranje slika u poređenju sa konvencionalnim difuznim modelima. Hadži Ali cilja na optimizaciju metode kako bi postigao ekvivalentna vremena zaključivanja dok zadržava sposobnost generisanja visokokvalitetnih slika bez obzira na odnos stranica.


Watch video about

ElasticDiffusion: Poboljšanje Generisanja Slika uz AI na Univerzitetu Rajs

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 9:34 a.m.

Podaci Salesforcea otkrivaju da veštačka intelige…

Salesforce je objavio detaljno izveštavanje o događaju kupovine tokom Cyber Week 2025, analizirajući podatke sa više od 1,5 milijardi globalnih potrošača.

Dec. 21, 2025, 9:28 a.m.

Uticaj veštačke inteligencije na digitalne reklam…

Tehnologije veštačke inteligencije (VI) postale su centralna sila u transformaciji digitalnog oglašavanja.

Dec. 21, 2025, 9:25 a.m.

Ova tihi kompanija za veštačku inteligenciju Mogl…

Dramatičan rast tehnoloških akcija u poslednje dve godine obogatio je mnoge investitore, i dok slave uspehe sa kompanijama poput Nvidia, Alphabet i Palantir Technologies, ključno je tražiti sledeću veliku priliku.

Dec. 21, 2025, 9:24 a.m.

Sistemi za nadzor video nadzorom zasnovani na veš…

U poslednjim godinama, gradovi širom sveta sve više integrišu veštačku inteligenciju (VI) u sisteme video nadzora radi poboljšanja praćenja javnih prostora.

Dec. 21, 2025, 9:14 a.m.

Generativna Optimizacija Mekana (GEO): Kako rangi…

Pretraga je evoluirao od plavih linkova i liste ključnih reči; sada ljudi direktno postavljaju pitanja AI alatima poput Google SGE, Bing AI i ChatGPT.

Dec. 21, 2025, 5:27 a.m.

Nezavisne delatnosti: Jesu li vaše online prodaje…

Želeli bismo da saznamo više o tome kako su nedavne promene u ponašanju pri online pretraživanju, izazvane usponom veštačke inteligencije, uticale na vaše poslovanje.

Dec. 21, 2025, 5:23 a.m.

Google kaže šta reći klijentima koji žele SEO za …

Danny Sullivan iz Google-a pružio je smernice SEO stručnjacima koji se suočavaju s klijentima željnim najnovijih informacija o strategijama SEO za veštačku inteligenciju.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today