lang icon English
Sept. 15, 2024, 12:46 a.m.
2353

ElasticDiffusion: piltide loomise parandamine AI-ga Rice'i ülikoolis

Brief news summary

Generatiivne tehisintellekt, eriti difusioonimudelid, seisavad tihti silmitsi väljakutsetega järjepidevate ja detailsete piltide loomisel, eriti peente detailide, nagu näosümmeetria säilitamisel mittesümmeetrilistes formaatides. Rice'i ülikooli teadlased on välja töötanud uue lähenemisviisi nimega ElasticDiffusion, mida esitles doktorant Moayed Haji Ali IEEE 2024 arvutinägemise ja mustrituvastuse konverentsil Seattle'is. Erinevalt varasematest mudelitest, nagu Stable Diffusion ja DALL-E, mis toimivad hästi ruudukujuliste piltidega, aga moonutavad teise kuvasuhtega pilte, täiustab ElasticDiffusion piltide loomist, eristades lokaalseid pikslitetaile globaalsetest kujudest. See edasiminek vähendab vigade esinemist mittesümmeetrilistes piltides, säilitades visuaalse kooskõla ilma täiendava treeninguta. Praegu töötab ElasticDiffusion kiirusel, mis on 6-9 korda aeglasem kui tavapärased mudelid, kuid teadlased optimeerivad selle toimivust, et see ühtiks olemasolevate meetoditega ja võimaldaks selle kasutamist erinevates kuvasuhetes.

Generatiivne tehisintellekt (AI), sealhulgas mudelid nagu Stable Diffusion, Midjourney ja DALL-E, seisab sageli silmitsi järjepidevate piltide loomisega, eriti kui tegemist on detailidega nagu näosümmeetria ja õige sõrmede kujutamine. Need mudelid genereerivad üldiselt ruudukujulisi pilte, mis tekitab probleeme, kui neid kasutatakse erineva kuvasuhtega piltide loomiseks, mille tulemuseks on anomaaliad, nagu lisa sõrmed või moonutatud kujundid. Nende probleemide lahendamiseks on Rice'i ülikooli arvutiteadlased välja töötanud ElasticDiffusioni, uue meetodi, mis kasutab eelkoolitatud difusioonimudelite eeliseid. Moayed Haji Ali, Rice'i doktorant, esitles seda meetodit IEEE 2024 arvutinägemise ja mustrituvastuse konverentsil Seattle'is. Haji Ali selgitas, et traditsioonilised difusioonimudelid suudavad genereerida pilte ainult kindla lahutusvõimega, mis on ülemäärase õppe tagajärg, kus AI-mudel toimib hästi tuttava andmete puhul, aga ei suuda kohaneda variatsioonidega. ElasticDiffusion täiustab lähenemist, eraldades piltide loomise ajal lokaalse ja globaalse teabe, selle asemel, et neid kombineerida.

See eraldamine aitab vältida visuaalseid ebatäiuslikkusi, mis tulenevad korduvast andmetest mittesümmeetriliste piltidega kohandamisel. Haji Ali märkis, et protsess hõlmab kõigepealt üldise skoori hankimist, mis kajastab pildi üldist struktuuri, millele järgneb pikslitaseme detailide täitmine osade kaupa. See meetod võimaldab luua selgemaid pilte erinevates kuvasuhetes, ilma et oleks vaja täiendavat mudeli treeningut. Kuigi ElasticDiffusion pakub pildi loomisel paremat järjepidevust ja kohanemisvõimet, kaasneb sellega ka kompromiss: praegu kulub piltide loomiseks 6-9 korda kauem aega võrreldes tavapäraste difusioonimudelitega. Haji Ali eesmärgiks on meetodi optimeerimine, et saavutada samaväärsed järeldusajad, säilitades samal ajal kõrgekvaliteediliste piltide loomise võime sõltumata kuvasuhtest.


Watch video about

ElasticDiffusion: piltide loomise parandamine AI-ga Rice'i ülikoolis

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 1, 2025, 2:28 p.m.

New Jersey AI-põhine turundus startup-idele: rekl…

startups New Jerseys on saanud juurdepääsu täiustatud tehisintellekti tööriistadele läbi integreeritud lahenduse, mille on välja töötanud LeapEngine, tuntud kohaliku digitaalse turundusagentuuri.

Nov. 1, 2025, 2:27 p.m.

Doola käivitab uue tehisintellekti kaasasutaja te…

AI Business-in-a-Box™ aitab nüüd üle 15 000 asutaja kogu maailma taustategevuste ja e-kaubanduse poe kasvu toetamisel NEW YORK CITY, NEW YORK / ACCESS Newswire / 30

Nov. 1, 2025, 2:19 p.m.

Sony tutvustab videoga ühilduva kaameratõestuse l…

Sony Electronics on teatanud, et käivitatakse tööstuse esimene kaamera autentsuse lahendus, mis on ühilduv videoga ja vastab C2PA (Content Provenance and Authenticity Koostöögrupp) standardile.

Nov. 1, 2025, 2:17 p.m.

Loo brändile sobivaid turundusmaterjale oma äri j…

Lai luua mõjuvat ja brändile vastavat sisu nõuab sageli märkimisväärset ajakulu, eelarvet ning disainiekspertiisi, mis võib väikestele ja keskmise suurusega ettevõtetele (VKEd) osutuda suureks väljakutseks.

Nov. 1, 2025, 2:12 p.m.

Nvidia investeerib kuni 1 miljard dollarit tehisi…

Nvidia, juhtiv tehnoloogiaettevõte, mis on tuntud oma edusammude poolest graafikakontrollerite (GPU-de) ja tehisintellekti (AI) valdkonnas, plaanib väidetavalt suurt investeeringut AI startupi Poolside arengusse, kirjutab viimati Bloomberg News.

Nov. 1, 2025, 2:10 p.m.

Google tutvustab tehisintellekti ülevaateid, muut…

Google tutvustas hiljuti uut funktsiooni nimega AI Overviews, mis pakub tehisintellekti poolt loodud kokkuvõtteid ning on nähtavalt esile tõstetud otsingutulemuste tipus.

Nov. 1, 2025, 10:22 a.m.

dNOVO rühmatöö näitab Kanadas 2025. aasta parimad…

Toronto, Ontario, 27.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today