Generativna veštačka inteligencija (AI), uključujući modele kao što su Stable Diffusion, Midjourney i DALL-E, često se suočava s izazovima u proizvodnji konzistentnih slika, posebno kada je reč o detaljima poput simetrije lica i prikaza prstiju. Ovi modeli generalno generišu kvadratne slike, što dovodi do problema kada je zadatak kreiranje slika u različitim odnosima stranica, rezultirajući anomalijama poput dodatnih prstiju ili izobličenih oblika. Kako bi rešili ove probleme, kompjuterski naučnici na Univerzitetu Rajs razvili su ElasticDiffusion, novu metodu koja koristi unapred trenirane difuzne modele. Moajed Hadži Ali, doktorand na Rajsu, prezentovao je ovu metodu na IEEE 2024 konferenciji o kompjuterskoj viziji i prepoznavanju obrazaca u Sijetlu. Hadži Ali je objasnio da tradicionalni difuzni modeli mogu generisati slike samo na određenoj rezoluciji, što je posledica prenaučenosti, gde AI model dobro radi sa poznatim podacima, ali se muči sa varijacijama. ElasticDiffusion poboljšava pristup razdvajanjem lokalnih i globalnih informacija tokom generisanja slike, umesto da ih kombinuje.
Ovo razdvajanje pomaže da se izbegnu vizuelne nesavršenosti koje nastaju zbog ponavljajućih podataka prilikom adaptacije na nekvadratne slike. Hadži Ali je napomenuo da proces uključuje inicijalno dobijanje globalnog skora koji obuhvata celokupnu strukturu slike, nakon čega se popunjavaju pikselni detalji po segmentima. Ova metoda omogućava generisanje jasnijih slika u različitim odnosima stranica, bez potrebe za dodatnim treniranjem modela. Iako ElasticDiffusion nudi poboljšanu konzistentnost i prilagodljivost u generisanju slika, postoji i kompromis: trenutno zahteva 6-9 puta duže vreme za kreiranje slika u poređenju sa konvencionalnim difuznim modelima. Hadži Ali cilja na optimizaciju metode kako bi postigao ekvivalentna vremena zaključivanja dok zadržava sposobnost generisanja visokokvalitetnih slika bez obzira na odnos stranica.
ElasticDiffusion: Poboljšanje Generisanja Slika uz AI na Univerzitetu Rajs
Salesforce je objavio detaljno izveštavanje o događaju kupovine tokom Cyber Week 2025, analizirajući podatke sa više od 1,5 milijardi globalnih potrošača.
Tehnologije veštačke inteligencije (VI) postale su centralna sila u transformaciji digitalnog oglašavanja.
Dramatičan rast tehnoloških akcija u poslednje dve godine obogatio je mnoge investitore, i dok slave uspehe sa kompanijama poput Nvidia, Alphabet i Palantir Technologies, ključno je tražiti sledeću veliku priliku.
U poslednjim godinama, gradovi širom sveta sve više integrišu veštačku inteligenciju (VI) u sisteme video nadzora radi poboljšanja praćenja javnih prostora.
Pretraga je evoluirao od plavih linkova i liste ključnih reči; sada ljudi direktno postavljaju pitanja AI alatima poput Google SGE, Bing AI i ChatGPT.
Želeli bismo da saznamo više o tome kako su nedavne promene u ponašanju pri online pretraživanju, izazvane usponom veštačke inteligencije, uticale na vaše poslovanje.
Danny Sullivan iz Google-a pružio je smernice SEO stručnjacima koji se suočavaju s klijentima željnim najnovijih informacija o strategijama SEO za veštačku inteligenciju.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today