Generativ kunstig intelligens (AI), inkludert modeller som Stable Diffusion, Midjourney og DALL-E, sliter ofte med å produsere konsistente bilder, spesielt når det gjelder detaljer som ansiktssymmetri og riktig representasjon av fingre. Disse modellene genererer generelt firkantede bilder, noe som fører til problemer når de skal lage bilder i forskjellige aspektsforhold, noe som resulterer i anomalier som ekstra fingre eller forvrengte former. For å løse disse problemene har datavitere ved Rice University utviklet ElasticDiffusion, en ny metode som utnytter forhåndstrente diffusjonsmodeller. Moayed Haji Ali, doktorgradsstudent ved Rice, presenterte denne metoden på IEEE 2024 Conference on Computer Vision and Pattern Recognition i Seattle. Haji Ali forklarte at tradisjonelle diffusjonsmodeller bare kan generere bilder på en bestemt oppløsning, som er en konsekvens av overtilpasning, hvor en AI-modell presterer godt på kjente data, men sliter med variasjoner. ElasticDiffusion forbedrer tilnærmingen ved å skille lokal og global informasjon under bildegenereringen, i stedet for å kombinere dem.
Denne separasjonen bidrar til å unngå visuelle feil som oppstår fra repetitiv data når den tilpasses ikke-firkantede bilder. Haji Ali bemerket at prosessen innebærer først å oppnå en global score som innkapsler bildets overordnede struktur, etterfulgt av å fylle inn pikselnivådetaljer i seksjoner. Denne metoden gjør det mulig å generere klarere bilder på tvers av forskjellige aspektsforhold uten at det er nødvendig med ytterligere modelltrening. Mens ElasticDiffusion gir økt konsistens og tilpasningsevne i bildegenerering, har det en trade-off: det krever for øyeblikket 6-9 ganger lengre tid å lage bilder sammenlignet med konvensjonelle diffusjonsmodeller. Haji Ali har som mål å optimalisere metoden for å oppnå tilsvarende inferenstider samtidig som den beholder evnen til å generere bilder av høy kvalitet uansett aspektsforhold.
ElasticDiffusion: Forbedring av bildegenerering med AI ved Rice University
Den rapporterte bruken av KI i reklame kan være underestimert, ettersom mye KI-integrasjon skjer bak kulissene – i redigering, effekter eller optimalisering – uten at det eksplisitt oppgis.
Integrasjonen av kunstig intelligens (KI) i søkemotoroptimalisering (SEO) har revolusjonert digital markedsføring, og forbedret effektivitet og virkningsgrad betydelig.
De siste årene har sosiale medieplattformer i økende grad tatt i bruk kunstig intelligens (KI) teknologier for å forbedre nettså sikkerhet, særlig gjennom AI-drevne verktøy for moderering av videoinnhold.
Cognizant, et ledende globalt profesjonelt tjenestefirma, har kunngjort store forbedringer av sin Neuro AI-plattform, utviklet i samarbeid med NVIDIA, en teknologileder kjent for fremskritt innen AI og grafikkbehandling.
Vista Social har gjort et stort fremskritt innen sosiale medier-håndtering ved å integrere banebrytende ChatGPT-teknologi i sin plattform, og blir dermed den første til å tilby AI-drevne tekstfunksjoner som forandrer hvordan bedrifter og enkeltpersoner håndterer sin nettnærvær.
CEO Sundar Pichai beskrev Googles tilnærming til å håndtere forsyningsbegrensninger i en periode med økende etterspørsel, og fremhevet den raske adopsjonen av Gemini 3 Pro, kunngjorde at over 8 millioner betalte seter er solgt til Gemini Enterprise, og la frem planer om å investere opptil 185 milliarder dollar i kapitalutgifter i 2026.
OpenAI har fullført oppkjøpet av io, en AI-maskinvare-startup tidligere kjent som Codeium, for 6,5 milliarder dollar.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today