lang icon En
Sept. 15, 2024, 12:46 a.m.
2770

ElasticDiffusion: Izboljšanje ustvarjanja slik z AI na univerzi Rice

Brief news summary

Generativna umetna inteligenca, še posebej modeli difuzije, pogosto naletijo na izzive pri ustvarjanju doslednih in podrobnih slik, zlasti pri vzdrževanju drobnih lastnosti, kot je simetrija obraza v ne-kvadratnih formatih. Raziskovalci na univerzi Rice so razvili nov pristop, imenovan ElasticDiffusion, ki ga je predstavil doktorski študent Moayed Haji Ali na konferenci IEEE 2024 o računalniškem vidu in prepoznavanju vzorcev v Seattlu. Za razliko od prejšnjih modelov, kot sta Stable Diffusion in DALL-E, ki se dobro obnesejo pri kvadratnih slikah, a imajo težave s popačenjem v drugih razmerjih stranic, ElasticDiffusion izboljšuje ustvarjanje slik s tem, da razlikuje podrobnosti slikovnih pik od globalnih oblik. Ta napredek zmanjšuje napake v nesorazmernih slikah, obenem pa zagotavlja vizualno skladnost brez potrebe po dodatnem usposabljanju. Trenutno ElasticDiffusion deluje s hitrostjo, ki je 6-9 krat počasnejša kot konvencionalni modeli; vendar pa raziskovalci optimizirajo njegovo delovanje, da bi bilo skladno z obstoječimi metodami in omogočilo njegovo uporabo pri različnih razmerjih stranic.

Generativna umetna inteligenca (AI), vključno z modeli, kot so Stable Diffusion, Midjourney in DALL-E, pogosto naleti na težave pri ustvarjanju doslednih slik, še posebej ko gre za podrobnosti, kot sta simetrija obraza in ustrezna predstavitev prstov. Ti modeli običajno generirajo kvadratne slike, kar povzroča težave pri ustvarjanju slik v različnih razmerjih stranic, kar vodi do anomalij, kot so dodatni prsti ali popačene oblike. Za reševanje teh težav so računalniški znanstveniki na univerzi Rice razvili ElasticDiffusion, nov pristop, ki izkorišča vnaprej naučene modele difuzije. Moayed Haji Ali, doktorski študent na univerzi Rice, je ta način predstavil na konferenci IEEE 2024 o računalniškem vidu in prepoznavanju vzorcev v Seattlu. Haji Ali je pojasnil, da tradicionalni modeli difuzije lahko ustvarjajo slike samo pri določeni ločljivosti, kar je posledica prekomerne prilagoditve, kjer se model AI dobro obnese na znanim podatkih, vendar ima težave z variacijami. ElasticDiffusion izboljšuje pristop z ločevanjem lokalnih in globalnih informacij med generiranjem slike, namesto da bi jih kombiniral.

Ta ločitev pomaga preprečiti vizualne nepravilnosti, ki izhajajo iz ponavljajočih se podatkov pri prilagajanju na nesorodne slike. Haji Ali je poudaril, da postopek vključuje začetno pridobivanje globalne ocene, ki zajema splošno strukturo slike, nato pa sledi izpolnjevanje podrobnosti na ravni slikovnih pik v odsekih. Ta metoda omogoča generiranje jasnejših slik v različnih razmerjih stranic brez potrebe po dodatnem usposabljanju modela. Medtem ko ElasticDiffusion ponuja izboljšano doslednost in prilagodljivost pri generiranju slik, to prinaša kompromis: trenutno traja 6-9 krat dlje za ustvarjanje slik v primerjavi s konvencionalnimi modeli difuzije. Haji Ali si prizadeva optimizirati metodo, da bi dosegli enakovredne čase inferenčnega sklepanja, obenem pa ohranili sposobnost generiranja visokokakovostnih slik ne glede na razmerje stranic.


Watch video about

ElasticDiffusion: Izboljšanje ustvarjanja slik z AI na univerzi Rice

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 1:22 p.m.

AIMM: Orodje, ki ga poganja umetna inteligenca, z…

AIMM: Inovativni okvir z umetno inteligenco za odkrivanje manipulacij na borznem trgu, ki jih spodbuja družbena omrežja V današnjem hitrem in nepredvidljivem okolju borznega trgovanja je družbena omrežja postala ključna sila, ki oblikuje dinamiko trga

Dec. 22, 2025, 1:16 p.m.

Izključeno: Filevine pridobi Pincites, podjetje z…

Pravna tehnološka podjetje Filevine je pridobilo Pincites, platformo za rdečiranje pogodb, ki temelji na umetni inteligenci, s čimer je okrepilo svoj položaj v korporativnem in transakcijskem pravnem svetu ter napredovalo svojo strategijo osredotočenosti na umetno inteligenco.

Dec. 22, 2025, 1:16 p.m.

Vpliv umetne inteligence na SEO: preoblikovanje p…

Umetna inteligenca (UI) hitro preoblikuje področje optimizacije spletnih iskalnikov (SEO), digitalnim tržnikom pa zagotavlja inovativna orodja in nove priložnosti za izboljšanje njihovih strategij ter doseganje vrhunskih rezultatov.

Dec. 22, 2025, 1:15 p.m.

Napredek pri odkrivanju globokih ponaredkov z zvo…

Napredek na področju umetne inteligence je imel ključno vlogo pri boju proti dezinformacijam z omogočanjem ustvarjanja dovršenih algoritmov, namenjenih odkrivanju deepfake vsebin—manipuliranih videoposnetkov, kjer je izvirna vsebina spremenjena ali nadomeščena, da bi proizvedla lažne predstavitve, namenjene zavajanju gledalcev in širjenju zavajajočih informacij.

Dec. 22, 2025, 1:14 p.m.

5 najboljših sistemov umetne inteligence za proda…

Vzpon umetne inteligence je preoblikoval prodajo z nadomeščanjem dolgih ciklov in ročnih sledilcev z hitrimi, samodejnimi sistemi, ki delujejo 24/7.

Dec. 22, 2025, 1:12 p.m.

Najnovejše novice o umetni inteligenci in marketi…

V hitro spreminjajočem se svetu umetne inteligence (UI) in marketinga nedavni pomembni dogodki oblikujejo industrijo, prinašajo pa tako nove priložnosti kot izzive.

Dec. 22, 2025, 9:22 a.m.

Poročilo pravi, da ima OpenAI boljše marže pri pr…

Objava je navedla, da je podjetje izboljšalo svoj „rob izračuna“ – notranjo metriko, ki predstavlja delež prihodka, preostalega po pokritju stroškov operativnih modelov za plačljive uporabnike njegovih korporativnih in potrošniških izdelkov.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today