lang icon En
Feb. 5, 2025, 12:22 a.m.
3117

ByteDance præsenterer OmniHuman: Et revolutionerende AI-videogenereringssystem

Brief news summary

ByteDance har lanceret OmniHuman, et banebrydende AI-system, der omdanner statiske billeder til engagerende, interaktive videoer med tale, musik og bevægelse. Denne fremgang repræsenterer et stort skridt inden for digital underholdning og kommunikation og muliggør helkropsanimationer med dynamiske bevægelser, hvilket er en væsentlig forbedring i forhold til tidligere teknologier, der kun fangede ansigts- eller overkropsbevægelser. OmniHuman benytter et omfattende datasæt på over 18.700 timer af video og anvender en sofistikeret "omni-conditions" træningsmetode. Denne tilgang kombinerer tekst, lyd og bevægelsesdata, hvilket resulterer i meget realistiske og hurtige videoudgange. Teknologiens alsidighed muliggør en bred vifte af indholdsproduktion, herunder taler og musikoptrædener, og opnår et kvalitetsniveau, der overgår tidligere modeller. Med store konkurrenter som Google, Meta og Microsoft, der udforsker lignende teknologier, placerer ByteDance's unikke tilgang dem godt i dette hurtigt udviklende område. Dog medfører stigningen af OmniHuman også etiske dilemmaer vedrørende potentiel misbrug af syntetiske medier. Forskningsteamet planlægger at præsentere deres fund på en kommende konference om computervision, hvilket yderligere bidrager til debatten om denne innovative teknologi.

Forskere hos ByteDance har skabt et banebrydende AI-system, der konverterer individuelle fotografier til realistiske videoer af mennesker, der taler, synger og bevæger sig flydende – en innovation, der er klar til at revolutionere digital underholdning og kommunikation. Det nyudviklede system, kaldet OmniHuman, producerer videoer i fuld længde, der viser personer, der gestikulerer og bevæger sig i synkronisering med deres tale, og overvinder dermed begrænsningerne fra tidligere AI-modeller, der kun animerede ansigtstræk eller overkroppe. Træningen af OmniHuman involverede imponerende 18. 700 timers videodata for at muliggøre realistisk bevægelse. Ifølge ByteDance-forskningsteamet, der offentliggjorde deres fund på arXiv, “har end-to-end menneskeanimation set betydelige forbedringer i de seneste år. Ikke desto mindre kæmper de nuværende metoder stadig med at skalere op som omfattende generelle videogenerationsmodeller, hvilket begrænser deres praktiske anvendelser. ” For at skabe OmniHuman anvendte teamet en innovativ strategi, der omfattede over 18. 700 timer af menneskelig videodata, integrerende forskellige input – tekst, lyd og kropsbevægelser. Denne “omni-betingede” træningsmetode gør det muligt for AI'en at trække på meget større og mere varierede datasæt end tidligere teknikker. Dette gennembrud inden for AI-videogenerering viser bevægelse i fuld længde og naturlige gestus. Forskningsgruppen bemærkede, “Vores primære indsigt er, at integrationen af flere betingelsessignaler, såsom tekst, lyd og positur, under træning kan minimere databesparelsen mærkbart. ” Denne teknologi betyder et stort skridt fremad i AI-genereret media, med kapaciteter der inkluderer at producere videoer af personer, der holder taler, og illustrerer emner, der spiller musikinstrumenter.

I forsøg overvandt OmniHuman eksisterende systemer inden for forskellige kvalitet målinger. Mens tech-giganter som Google, Meta og Microsoft konkurrerer om at udvikle næste generations video-AI-teknologier, kan ByteDance's fremskridt give et konkurrencefordel til moderfirmaet TikTok i dette hurtigt udviklende landskab. Eksperter mener, at denne teknologi har potentialet til at revolutionere underholdningsproduktion, oprettelse af uddannelsesindhold og digital kommunikation. Dog rejser det også bekymringer om mulig misbrug af syntetisk media til bedrageriske formål. Forskerne har til hensigt at præsentere deres fund på en kommende konference om computer vision, selvom de endnu ikke har offentliggjort de specifikke detaljer.


Watch video about

ByteDance præsenterer OmniHuman: Et revolutionerende AI-videogenereringssystem

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 23, 2025, 1:26 p.m.

15 måder, salget har ændret sig i år i AI-æraen

Over de sidste 18 måneder har Team SaaStr dykket ned i AI og salg, med en kraftig acceleration begyndende i juni 2025.

Dec. 23, 2025, 1:23 p.m.

OpenAI's GPT-5: Hvad Vi Ved Indtil Nu

OpenAI er ved at forberede lanceringen af GPT-5, den næste store fremskridt i deres serie af store sprogmodeller, med forventet udgivelse i begyndelsen af 2026.

Dec. 23, 2025, 1:20 p.m.

AI i SEO: Forvandler indholdsoprettelse og -optim…

Kunstig intelligens (AI) ændrer hurtigt feltet for indholdsproduktion og -optimering inden for søgemaskineoptimering (SEO).

Dec. 23, 2025, 1:20 p.m.

AI Video Konferenceløsninger forbedrer samarbejde…

Skiftet til fjernarbejde har fremhævet det afgørende behov for effektive kommunikationsværktøjer, hvilket har ført til fremkomsten af AI-drevne videokonference-løsninger, der muliggør problemfri samarbejde over afstande.

Dec. 23, 2025, 1:17 p.m.

AI i medicin markedsstørrelse, andel, vækst | CAG…

Oversigt Det globale marked for AI i medicin forventes at nå ca

Dec. 23, 2025, 9:30 a.m.

Googles Danny Sullivan og John Mueller om SEO for…

John Mueller fra Google var vært for Danny Sullivan, også fra Google, i Search Off the Record-podcasten for at diskutere "Tankerne om SEO & SEO for AI".

Dec. 23, 2025, 9:26 a.m.

Lexus prøver kræfter med generativ AI i nyt julem…

Dykbrief: Lexus har lanceret en julemarkedsføringskampagne skabt ved hjælp af generativ kunstig intelligens, ifølge en pressemeddelelse

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today