Forskere hos ByteDance har skabt et banebrydende AI-system, der konverterer individuelle fotografier til realistiske videoer af mennesker, der taler, synger og bevæger sig flydende – en innovation, der er klar til at revolutionere digital underholdning og kommunikation. Det nyudviklede system, kaldet OmniHuman, producerer videoer i fuld længde, der viser personer, der gestikulerer og bevæger sig i synkronisering med deres tale, og overvinder dermed begrænsningerne fra tidligere AI-modeller, der kun animerede ansigtstræk eller overkroppe. Træningen af OmniHuman involverede imponerende 18. 700 timers videodata for at muliggøre realistisk bevægelse. Ifølge ByteDance-forskningsteamet, der offentliggjorde deres fund på arXiv, “har end-to-end menneskeanimation set betydelige forbedringer i de seneste år. Ikke desto mindre kæmper de nuværende metoder stadig med at skalere op som omfattende generelle videogenerationsmodeller, hvilket begrænser deres praktiske anvendelser. ” For at skabe OmniHuman anvendte teamet en innovativ strategi, der omfattede over 18. 700 timer af menneskelig videodata, integrerende forskellige input – tekst, lyd og kropsbevægelser. Denne “omni-betingede” træningsmetode gør det muligt for AI'en at trække på meget større og mere varierede datasæt end tidligere teknikker. Dette gennembrud inden for AI-videogenerering viser bevægelse i fuld længde og naturlige gestus. Forskningsgruppen bemærkede, “Vores primære indsigt er, at integrationen af flere betingelsessignaler, såsom tekst, lyd og positur, under træning kan minimere databesparelsen mærkbart. ” Denne teknologi betyder et stort skridt fremad i AI-genereret media, med kapaciteter der inkluderer at producere videoer af personer, der holder taler, og illustrerer emner, der spiller musikinstrumenter.
I forsøg overvandt OmniHuman eksisterende systemer inden for forskellige kvalitet målinger. Mens tech-giganter som Google, Meta og Microsoft konkurrerer om at udvikle næste generations video-AI-teknologier, kan ByteDance's fremskridt give et konkurrencefordel til moderfirmaet TikTok i dette hurtigt udviklende landskab. Eksperter mener, at denne teknologi har potentialet til at revolutionere underholdningsproduktion, oprettelse af uddannelsesindhold og digital kommunikation. Dog rejser det også bekymringer om mulig misbrug af syntetisk media til bedrageriske formål. Forskerne har til hensigt at præsentere deres fund på en kommende konference om computer vision, selvom de endnu ikke har offentliggjort de specifikke detaljer.
ByteDance præsenterer OmniHuman: Et revolutionerende AI-videogenereringssystem
Over de sidste 18 måneder har Team SaaStr dykket ned i AI og salg, med en kraftig acceleration begyndende i juni 2025.
OpenAI er ved at forberede lanceringen af GPT-5, den næste store fremskridt i deres serie af store sprogmodeller, med forventet udgivelse i begyndelsen af 2026.
Kunstig intelligens (AI) ændrer hurtigt feltet for indholdsproduktion og -optimering inden for søgemaskineoptimering (SEO).
Skiftet til fjernarbejde har fremhævet det afgørende behov for effektive kommunikationsværktøjer, hvilket har ført til fremkomsten af AI-drevne videokonference-løsninger, der muliggør problemfri samarbejde over afstande.
Oversigt Det globale marked for AI i medicin forventes at nå ca
John Mueller fra Google var vært for Danny Sullivan, også fra Google, i Search Off the Record-podcasten for at diskutere "Tankerne om SEO & SEO for AI".
Dykbrief: Lexus har lanceret en julemarkedsføringskampagne skabt ved hjælp af generativ kunstig intelligens, ifølge en pressemeddelelse
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today