Skapandi gervigreind (AI), þ. m. t. líkön eins og Stable Diffusion, Midjourney og DALL-E, á oft í erfiðleikum með að framleiða stöðugar myndir, sérstaklega þegar kemur að smáatriðum eins og andlitssamhverfu og viðeigandi fingraframsetningu. Þessi líkön framleiða almennt ferkantaðar myndir, sem leiðir til vandamála þegar þarf að búa til myndir með mismunandi hlutföllum, sem veldur frávikum eins og aukafingrum eða afmynduðum formum. Til að takast á við þessi vandamál hafa tölvunarfræðingar hjá Rice háskóla þróað ElasticDiffusion, nýja aðferð sem nýtir fyrirfram þjálfuð dreifingarlíkön. Moayed Haji Ali, doktorsnemi við Rice, kynnti þessa aðferð á IEEE 2024 ráðstefnunni um tölvusjón og mynsturþekkingu í Seattle. Haji Ali útskýrði að hefðbundin dreifingarlíkön geta aðeins framleitt myndir með ákveðinni upplausn, sem er afleiðing oflæringar, þar sem AI líkan stendur sig vel á þekkdu gögnum en á í erfiðleikum með tilbrigði. ElasticDiffusion bætir nálgunina með því að aðgreina staðbundnar og alheimsupplýsingar meðan á myndagerð stendur, frekar en að sameina þær.
Þessi aðgreining hjálpar til við að forðast sjónrænar ófullkomleika sem koma upp vegna endurtekinna gagna við aðlögun að óferkantaðar myndir. Haji Ali tók fram að ferlið felur í sér að byrja á því að fá alheimsstig sem umlykur heildarbyggingu myndarinnar, og fylla síðan út smáatriði á pixilstigi í hlutum. Þessi aðferð gerir kleift að búa til skýrari myndir með mismunandi hlutföllum án þess að þurfi viðbótar þjálfun líkana. Þó ElasticDiffusion bjóði upp á aukna stöðugleika og aðlögunarhæfni í myndagerð, þá þarf það nú 6-9 sinnum lengri tíma til að búa til myndir samanborið við hefðbundin dreifingarlíkön. Haji Ali stefnir að því að hámarka aðferðina til að ná sambærilegum ályktunartímum en viðhalda getu til að framleiða hágæða myndir óháð hlutföllum.
ElasticDiffusion: Aukning á Myndagerð með Gervigreind hjá Rice háskóla
Samfélagsmiðlarnir nota sífellt meira gervigreind (GA) til að bæta eftirlit með myndböndum, til að takast á við áfram vaxandi fjölda myndbanda sem eru orðnir ríkjandi miðlunarform á netinu.
STEFNAÁÄRABROT: Eftir ár af strangari takmörkunum hefur ákvörðunin um að leyfa sölu á Nvidia H200 örgjörvum til Kína vakið mótmæli hjá sumum Repúblikanum.
Rýrnunarleiðir sem eru knúnar af gervigreind hafa markað 2025 atvinnumarkaðinn, þar sem stór fyrirtæki hafa tilkynnt um þúsundir störfustyrkja sem rekja má til framfara í gervigreind.
RankOS™ eflir vörumerkjavísbendingu og tilvitnanir á Perplexity AI og öðrum leitarvélum sem byggja á svörum Perplexity SEO stofnunarþjónusta New York, NY, 19
Upprunaleið að þessari grein birtist í CNBC's Inside Wealth fréttabréfi, skrifuð af Robert Frank, sem þjónar sem vikuleg heimild fyrir fjárfesta með hátt eigið fé og neytendur.
Fyrirsagnir hafa beinst að eins og Disney leggur til fjárfestingu í OpenAI sem nemur milljarði dollara og spekulað um hvers vegna Disney valdi OpenAI frekar en Google, sem fyrirtækið kærist yfir vegna meintum höfundarréttarbrotum.
Salesforce hefur gefið út ítarlegt skýrslu um verslunarkeppnina Cyber Week 2025, þar sem greint er gögn frá yfir 1,5 milljörðum alþjóðlegra kaupanda.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today