lang icon En
Sept. 15, 2024, 12:46 a.m.
2767

ElasticDiffusion: AI:n Kuvanluonnin Parantaminen Rice-yliopistossa

Brief news summary

Generatiivinen tekoäly, erityisesti diffuusio-mallit, kohtaa usein haasteita johdonmukaisten ja yksityiskohtaisten kuvien tuottamisessa, erityisesti hienojen piirteiden, kuten kasvon symmetrian, ylläpitämisessä ei-neliömuotoisissa formaateissa. Rice-yliopiston tutkijat ovat kehittäneet ElasticDiffusion-nimisen uuden lähestymistavan, jonka tohtoriopiskelija Moayed Haji Ali esitteli IEEE 2024 Computer Vision and Pattern Recognition -konferenssissa Seattlessa. Toisin kuin aikaisemmat mallit, kuten Stable Diffusion ja DALL-E, jotka menestyvät hyvin neliönmuotoisissa kuvissa mutta kamppailevat vääristymien kanssa muissa kuvasuhteissa, ElasticDiffusion parantaa kuvien luomista erottelemalla paikalliset pikseliyksityiskohdat globaaleista muodoista. Tämä edistysaskel minimoi virheet ei-neliömuotoisissa kuvissa varmistaen visuaalisen koherenssin ilman lisäkoulutuksen tarvetta. Tällä hetkellä ElasticDiffusion toimii nopeudella, joka on 6-9 kertaa hitaampaa kuin perinteiset mallit; kuitenkin, tutkijat optimoivat sen suorituskykyä, jotta se vastaisi nykyisiä menetelmiä, mikä mahdollistaa sen käytön erilaisissa kuvasuhteissa.

Generatiivinen tekoäly (AI), mukaan lukien mallit kuten Stable Diffusion, Midjourney ja DALL-E, kamppailee usein johdonmukaisten kuvien tuottamisessa, erityisesti yksityiskohtien, kuten kasvojen symmetrian ja oikean sormien esityksen, osalta. Nämä mallit tuottavat yleensä neliönmuotoisia kuvia, mikä aiheuttaa ongelmia, kun niiden on luotava kuvia eri kuvasuhteissa, mikä johtaa poikkeavuuksiin, kuten ylimääräisiin sormiin tai vääristyneisiin muotoihin. Näiden ongelmien ratkaisemiseksi Rice-yliopiston tietojenkäsittelytieteilijät ovat kehittäneet ElasticDiffusion-nimisen uuden menetelmän, joka hyödyntää etukäteen koulutettuja diffuusiomalleja. Rice-yliopiston tohtoriopiskelija Moayed Haji Ali esitteli menetelmää IEEE 2024 Computer Vision and Pattern Recognition -konferenssissa Seattlessa. Haji Ali selitti, että perinteiset diffuusiomallit voivat tuottaa kuvia vain tietyllä tarkkuudella, mikä on seurausta ylioppimisesta, jossa tekoälymalli menestyy hyvin tutussa datassa mutta kamppailee vaihtelujen kanssa. ElasticDiffusion parantaa lähestymistapaa erottamalla paikallisen ja globaalin tiedon kuvien luontiprosessin aikana sen sijaan, että ne yhdistettäisiin.

Tämä erottelu auttaa välttämään visuaalisia epätäydellisyyksiä, jotka johtuvat toistuvasta datasta, kun sovelletaan ei-neliömuotoisiin kuviin. Haji Ali huomautti, että prosessi sisältää aluksi globaalin pistemäärän saamisen, joka kattaa kuvan yleisrakenteen, ja sitten täytetään pikselitason yksityiskohdat. Tämä menetelmä mahdollistaa selkeämpien kuvien luomisen eri kuvasuhteissa ilman, että tarvitaan ylimääräistä mallikoulutusta. Vaikka ElasticDiffusion tarjoaa parannettua johdonmukaisuutta ja mukautuvuutta kuvien luomisessa, siihen liittyy kompromissi: tällä hetkellä se vaatii 6-9 kertaa kauemman ajan kuvien luomiseen verrattuna perinteisiin diffuusiomalleihin. Haji Ali pyrkii optimoimaan menetelmää saavuttamaan samankaltaiset päätelaiteajat samalla säilyttäen kyvyn tuottaa korkealaatuisia kuvia kuvasuhteesta riippumatta.


Watch video about

ElasticDiffusion: AI:n Kuvanluonnin Parantaminen Rice-yliopistossa

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 1:22 p.m.

AIMM: tekoälyohjattu kehys sosiaalisen median vai…

AIMM: Innovatiivinen tekoälypohjainen järjestelmä sosiaalisen median vaikuttaman osakepääoman manipuloinnin havaitsemiseksi Nykyisessä nopeasti muuttuvassa osakekaupan ympäristössä sosiaalinen media on noussut keskeiseksi voimaksi, joka muokkaa markkinadynamiikkaa

Dec. 22, 2025, 1:16 p.m.

Exklusivi: Filevine ostaa Pincitesin, tekoälypohj…

Oikeudellisen teknologian yritys Filevine on hankkinut Pincitesin, tekoälyä hyödyntävän sopimusten muokkaus- ja avointen sopimuskäytäntöjen yrityksen, vahvistaen jalansijaansa yhtiö- ja transaktionaalisessa oikeudessa sekä edistäen tekoälykeskeistä strategiaansa.

Dec. 22, 2025, 1:16 p.m.

Tekoälyn vaikutus hakukoneoptimointiin: Muutoksen…

Tekoäly (AI) muokkaa nopeasti hakukoneoptimoinnin (SEO) alaa, tarjoten digitaalisen markkinoinnin ammattilaisille innovatiivisia työkaluja ja uusia mahdollisuuksia hienosäätää strategioitaan ja saavuttaa parempia tuloksia.

Dec. 22, 2025, 1:15 p.m.

Syväväärennösten tunnistuksen edistysaskeleet tek…

Keinotekoisen älykäisyyden kehitys on näytellyt ratkaisevaa roolia väärän tiedon torjunnassa mahdollistamalla kehittyneiden algoritmien luomisen, jotka on suunniteltu tunnistamaan deepfake-videot – manipuloituja videoita, joissa alkuperäinen sisältö on muokattu tai korvattu tarkoituksenaan hämmentää katsojia ja levittää harhaanjohtavaa tietoa.

Dec. 22, 2025, 1:14 p.m.

5 parasta tekoälypohjaista myyntijärjestelmää, jo…

- Nousun tehälyksen nousu on mullistanut myyntiä korvaamalla pitkät kierrokset ja manuaaliset seurannat nopeilla, automatisoiduilla järjestelmillä, jotka toimivat 24/7.

Dec. 22, 2025, 1:12 p.m.

Uusin tekoäly- ja markkinointiuutiset: viikoittai…

Nopeasti kehittyvässä tekoälyn (AI) ja markkinoinnin maailmassa viimeaikaiset merkittävät kehitykset muokkaavat alaa, tuoden mukanaan sekä uusia mahdollisuuksia että haasteita.

Dec. 22, 2025, 9:22 a.m.

OpenAI näkee parempia marginaaleja liiketoimintam…

Julkaisu totesi, että yritys paransi “laskentakatettaan”, eli sisäisen mittariston, joka kuvaa tulovirran osuutta jäljellä olevasta tulosta operatiivisten mallien kulujen kattamisen jälkeen yrityksen yritys- ja kuluttajatuotteiden käyttäjille.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today