lang icon En
Sept. 15, 2024, 12:46 a.m.
2759

ElasticDiffusion: Aukning á Myndagerð með Gervigreind hjá Rice háskóla

Brief news summary

Skapandi gervigreind, sérstaklega dreifingarlíkön, á oft í erfiðleikum með að framleiða stöðugar og nákvæmar myndir, sérstaklega með að viðhalda fínum eiginleikum eins og andlitssamhverfu í óferkantaðar formum. Rannsakendur hjá Rice háskóla hafa þróað nýja nálgun sem kallast ElasticDiffusion, eins og kynnt var af doktorsnema Moayed Haji Ali á IEEE 2024 ráðstefnunni um tölvusjón og mynsturþekkingu í Seattle. Ólíkt eldri líkönum eins og Stable Diffusion og DALL-E, sem standa sig vel í ferkantaðar myndum en eiga í erfiðleikum með afmyndun í öðrum hlutaþætti, bætir ElasticDiffusion myndagerð með því að aðgreina staðbundin pixilatriði frá heildarformum. Þessi framfarir minnka villur í óferkantaðar myndum meðan sjónrænt samhengi er tryggt, án þess að þurfi viðbótarþjálfun. Núverandi ElasticDiffusion starfar á hraða sem er 6-9 sinnum hægari en hefðbundin líkön; þó er verið að hámarka frammistöðuna til að samræmast núverandi aðferðum, sem gerir það mögulegt að nota það í mismunandi hlutföllum.

Skapandi gervigreind (AI), þ. m. t. líkön eins og Stable Diffusion, Midjourney og DALL-E, á oft í erfiðleikum með að framleiða stöðugar myndir, sérstaklega þegar kemur að smáatriðum eins og andlitssamhverfu og viðeigandi fingraframsetningu. Þessi líkön framleiða almennt ferkantaðar myndir, sem leiðir til vandamála þegar þarf að búa til myndir með mismunandi hlutföllum, sem veldur frávikum eins og aukafingrum eða afmynduðum formum. Til að takast á við þessi vandamál hafa tölvunarfræðingar hjá Rice háskóla þróað ElasticDiffusion, nýja aðferð sem nýtir fyrirfram þjálfuð dreifingarlíkön. Moayed Haji Ali, doktorsnemi við Rice, kynnti þessa aðferð á IEEE 2024 ráðstefnunni um tölvusjón og mynsturþekkingu í Seattle. Haji Ali útskýrði að hefðbundin dreifingarlíkön geta aðeins framleitt myndir með ákveðinni upplausn, sem er afleiðing oflæringar, þar sem AI líkan stendur sig vel á þekkdu gögnum en á í erfiðleikum með tilbrigði. ElasticDiffusion bætir nálgunina með því að aðgreina staðbundnar og alheimsupplýsingar meðan á myndagerð stendur, frekar en að sameina þær.

Þessi aðgreining hjálpar til við að forðast sjónrænar ófullkomleika sem koma upp vegna endurtekinna gagna við aðlögun að óferkantaðar myndir. Haji Ali tók fram að ferlið felur í sér að byrja á því að fá alheimsstig sem umlykur heildarbyggingu myndarinnar, og fylla síðan út smáatriði á pixilstigi í hlutum. Þessi aðferð gerir kleift að búa til skýrari myndir með mismunandi hlutföllum án þess að þurfi viðbótar þjálfun líkana. Þó ElasticDiffusion bjóði upp á aukna stöðugleika og aðlögunarhæfni í myndagerð, þá þarf það nú 6-9 sinnum lengri tíma til að búa til myndir samanborið við hefðbundin dreifingarlíkön. Haji Ali stefnir að því að hámarka aðferðina til að ná sambærilegum ályktunartímum en viðhalda getu til að framleiða hágæða myndir óháð hlutföllum.


Watch video about

ElasticDiffusion: Aukning á Myndagerð með Gervigreind hjá Rice háskóla

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Gervigreindartól fyrir myndbandsaðgát og umsjón s…

Samfélagsmiðlarnir nota sífellt meira gervigreind (GA) til að bæta eftirlit með myndböndum, til að takast á við áfram vaxandi fjölda myndbanda sem eru orðnir ríkjandi miðlunarform á netinu.

Dec. 21, 2025, 1:38 p.m.

Bandaríkin endurupaka á lögbann á útflutning á ge…

STEFNAÁÄRABROT: Eftir ár af strangari takmörkunum hefur ákvörðunin um að leyfa sölu á Nvidia H200 örgjörvum til Kína vakið mótmæli hjá sumum Repúblikanum.

Dec. 21, 2025, 1:38 p.m.

Gervigreind var á bak við yfir 50.000 uppsagnir á…

Rýrnunarleiðir sem eru knúnar af gervigreind hafa markað 2025 atvinnumarkaðinn, þar sem stór fyrirtæki hafa tilkynnt um þúsundir störfustyrkja sem rekja má til framfara í gervigreind.

Dec. 21, 2025, 1:36 p.m.

Perplexity SEO þjónusta hefst – NEWMEDIA.COM leið…

RankOS™ eflir vörumerkjavísbendingu og tilvitnanir á Perplexity AI og öðrum leitarvélum sem byggja á svörum Perplexity SEO stofnunarþjónusta New York, NY, 19

Dec. 21, 2025, 1:22 p.m.

fjölskyldufyrirtæki Eric Schmidt fjárfestir í 22 …

Upprunaleið að þessari grein birtist í CNBC's Inside Wealth fréttabréfi, skrifuð af Robert Frank, sem þjónar sem vikuleg heimild fyrir fjárfesta með hátt eigið fé og neytendur.

Dec. 21, 2025, 1:21 p.m.

Framtíð markaðssetningar - Yfirlit: Af hverju „ba…

Fyrirsagnir hafa beinst að eins og Disney leggur til fjárfestingu í OpenAI sem nemur milljarði dollara og spekulað um hvers vegna Disney valdi OpenAI frekar en Google, sem fyrirtækið kærist yfir vegna meintum höfundarréttarbrotum.

Dec. 21, 2025, 9:34 a.m.

Söluupplýsingar Salesforce sýna að gervigreind og…

Salesforce hefur gefið út ítarlegt skýrslu um verslunarkeppnina Cyber Week 2025, þar sem greint er gögn frá yfir 1,5 milljörðum alþjóðlegra kaupanda.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today