Feb. 5, 2025, 12:22 a.m.
3004

ByteDance predstavuje OmniHuman: revolučný systém na generovanie videa pomocou AI.

Brief news summary

ByteDance spustil OmniHuman, prelomový AI systém, ktorý transformuje statické obrázky na pútavé, interaktívne videá so zvukom, hudbou a pohybom. Tento pokrok predstavuje významný míľnik v digitálnej zábave a komunikácii, umožňujúci animácie celého tela s dynamickými gestami, čo je významné zlepšenie oproti predchádzajúcim technológiám, ktoré zachytávali iba pohyby tváre alebo hornej časti tela. OmniHuman využíva rozsiahly súbor údajov s viac ako 18 700 hodinami videa a zamestnáva sofistikovanú metódu tréningu "omni-conditions". Tento prístup kombinuje text, zvuk a pohybové dáta, čo vedie k veľmi realistickým a rýchlym video výstupom. Univerzálnosť technológie umožňuje široké spektrum tvorby obsahu, vrátane prejavov a hudobných vystúpení, pričom dosahuje kvalitu, ktorá prekonáva predchádzajúce modely. S veľkými konkurentmi, ako sú Google, Meta a Microsoft, ktorí skúmajú podobné technológie, je jedinečný prístup ByteDance dobre situovaný v tomto rýchlo sa vyvíjajúcom poli. Nárast OmniHuman však prináša aj etické dilemy týkajúce sa potenciálneho zneužitia syntetických médií. Výskumný tím plánuje predstaviť svoje zistenia na nadchádzajúcej konferencii o počítačovej vízii, čím ďalej prispieva k diskurzu okolo tejto inovatívnej technológie.

Vedci z ByteDance vytvorili revolučný systém AI, ktorý premení jednotlivé fotografie na realistické videá ľudí, ktorí hovoria, spievajú a plynulo sa pohybujú – inovačný krok, ktorý má potenciál zmeniť digitálnu zábavu a komunikáciu. Novovytvorený systém, nazvaný OmniHuman, produkuje videá celého tela, ktoré zobrazujú jednotlivcov gestikulujúcich a pohybujúcich sa v súlade s ich rečou, prekonávajúc obmedzenia predchádzajúcich modelov AI, ktoré animovali iba tváre alebo horné časti tiel. Tréning OmniHuman zahŕňal pôsobivých 18 700 hodín videodat, aby sa zabezpečil realistický pohyb. Podľa výskumnej skupiny ByteDance, ktorá zverejnila svoje zistenia na arXiv, „animácia ľudí od začiatku do konca zaznamenala v posledných rokoch výrazné zlepšenia. Napriek tomu sú súčasné metódy stále obmedzené v škálovateľnosti ako rozsiahle generátory videí, čo obmedzuje ich praktické aplikácie. “ Na vytvorenie OmniHuman tím využil inovatívnu stratégiu zahŕňajúcu viac ako 18 700 hodín videodat ľudí a integroval rôzne vstupy – text, zvuk a pohyby tela. Táto tréningová metóda „omni-podmienok“ umožňuje AI čerpať z oveľa väčších a rozmanitejších databáz ako predchádzajúce techniky. Tento prelom v generovaní videí AI prezentuje pohyb celého tela a prirodzené gestá. Výskumná skupina poznamenala: „Naším hlavným postrehom je, že integrácia viacerých podmienkových signálov, ako je text, zvuk a póza, počas tréningu môže významne minimalizovať plytvanie dátami. “ Táto technológia predstavuje výrazný pokrok v mediatvorbe generovanej AI, pričom jej schopnosti zahŕňajú producovanie videí jednotlivcov, ktorí prednášajú alebo ilustrujú hudobné nástroje.

V testoch OmniHuman prekonal existujúce systémy vo viacerých kvalitativných metrikách. Keďže technologickí giganti ako Google, Meta a Microsoft súťažia vo vývoji technológií videa AI novej generácie, pokrok ByteDance by mohol poskytnúť konkurenčnú výhodu jeho materskej spoločnosti TikTok v tejto rýchlo sa vyvíjajúcej oblasti. Odborníci veria, že táto technológia má potenciál revolučne zmeniť produkciu zábavy, tvorbu vzdelávacieho obsahu a digitálnu komunikáciu. Avšak tiež vyvoláva obavy o možné zneužitie syntetických médií na klamné účely. Vedci plánujú predstaviť svoje zistenia na nadchádzajúcej konferencii o počítačovom videní, aj keď zatiaľ neohlásili konkrétne podrobnosti.


Watch video about

ByteDance predstavuje OmniHuman: revolučný systém na generovanie videa pomocou AI.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

AI poháňa rekordný predaj v Cyber Week za 336,6 m…

Analýza spoločnosti Salesforce o nákupnom období Cyber Week 2025 odhalila rekordný globálny maloobchodný predaj vo výške 336,6 miliardy dolárov, čo predstavuje 7 % nárast v porovnaní s predchádzajúcim rokom.

Dec. 15, 2025, 1:24 p.m.

Riziká vymretia AI: Musk a Amodei varujú pred 10-…

Rýchly pokrok v oblasti umelnej inteligencie (UI) vyvolal významnú diskusiu a obavy medzi odborníkmi, najmä čo sa týka jej dlhodobého dopadu na ľudstvo.

Dec. 15, 2025, 1:21 p.m.

Vstúpte skôr, než to urobí Wall Street: Táto akci…

Toto je sponzorovaný obsah; Barchart nevyjadruje podporu uvedeným webovým stránkam alebo produktom.

Dec. 15, 2025, 1:16 p.m.

AlphaCode od Google DeepMind: Umelá inteligencia …

Nedávno spoločnosť Google DeepMind predstavila inovatívny systém umelej inteligencie s názvom AlphaCode, ktorý znamená veľký prelom v oblasti umelej inteligencie a vývoja softvéru.

Dec. 15, 2025, 1:15 p.m.

Dobrý známy SEO vysvetľuje, prečo na vás útočia A…

Pr closely sledujem vznik agentového SEO, presvedčený, že s postupom schopností v priebehu nasledujúcich rokov budú agenti významne ovplyvňovať odvetvie.

Dec. 15, 2025, 1:10 p.m.

Peter Lington zo Salesforce o príprave obranných …

Peter Lington, viceprezident pre región v oddelení Vojny spoločnosti Salesforce, zdôrazňuje transformačné účinky, ktoré budú mať pokročilé technológie na oddelenie Vojny v priebehu najbližších troch až piatich rokov.

Dec. 15, 2025, 9:35 a.m.

Strategická pozícia Sprout Social v meniacom sa p…

Sprout Social si pevne vybudovalo pozíciu popredného hráča v odvetví správy sociálnych médií tým, že prijalo pokročilú AI technológiu a vytvorilo strategické partnerstvá, ktoré podporujú inovácie a zlepšujú ponuku služieb.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today