lang icon En
Feb. 5, 2025, 12:22 a.m.
3060

ByteDance predstavlja OmniHuman: revolucionarni sistem za generaciju video sadržaja pomoću veštačke inteligencije.

Brief news summary

ByteDance je lansirao OmniHuman, revolucionarni AI sistem koji pretvara statične slike u zanimljive, interaktivne video sadržaje sa govorom, muzikom i pokretom. Ovaj napredak predstavlja značajnu etapu u digitalnoj zabavi i komunikaciji, omogućavajući animacije celog tela sa dinamičnim gestovima, što je značajno unapređenje u odnosu na prethodne tehnologije koje su zabeležile samo pokrete lica ili gornjeg dela tela. OmniHuman koristi obiman skup podataka od preko 18,700 sati videa i primenjuje sofisticiranu metodu obuke "omni-conditions". Ovaj pristup kombinuje tekst, zvuk i podatke o pokretu, rezultirajući veoma realističnim i brzim video izlazima. Svestranost tehnologije omogućava širok spektar kreiranja sadržaja, uključujući govore i muzičke nastupe, postižući nivo kvaliteta koji nadmašuje ranije modele. Sa glavnim konkurentima kao što su Google, Meta i Microsoft koji istražuju slične tehnologije, jedinstveni pristup ByteDance-a ga dobro pozicionira u ovom brzo razvijajućem polju. Međutim, pojava OmniHuman-a takođe donosi etičke dileme u vezi sa potencijalnom zloupotrebom sintetičkih medija. Istraživački tim planira da predstavi svoja saznanja na nadolazećoj konferenciji o kompjuterskom vidu, dodatno doprinoseći diskursu koji se odnosi na ovu inovativnu tehnologiju.

Istraživači iz ByteDance-a kreirali su revolucionarni AI sistem koji pretvara pojedinačne fotografije u realistične video snimke ljudi koji govore, pevaju i se kreću fluidno—inovacija koja bi mogla da revolucionizuje digitalnu zabavu i komunikaciju. Novi razvijeni sistem, nazvan OmniHuman, proizvodi video snimke cele figure koji prikazuju pojedince kako gestikuliraju i se kreću u skladu sa svojim govorom, prevazilazeći ograničenja ranijih AI modela koji su samo animirali lica ili gornje delove tela. Obuka OmniHuman-a uključivala je impresivnih 18. 700 sati video podataka kako bi se olakšalo realistična kretanja. Prema istraživačkom timu ByteDance-a, koji je objavio svoja otkrića na arXiv-u, “Animacija ljudi od početka do kraja je značajno napredovala u poslednjim godinama. Ipak, trenutne metode se još uvek bore da se skaliraju kao opsežni modeli generisanja video sadržaja, što ograničava njihove praktične primene. ” Da bi kreirali OmniHuman, tim je iskoristio inovativnu strategiju koja uključuje više od 18. 700 sati ljudskih video podataka, integrišući različite ulaze—tekst, audio i pokrete tela. Ova „omni-uslovna“ metoda obuke omogućava AI-u da koristi mnogo veće i raznovrsnije skupove podataka nego ranije tehnike. Ovo otkriće u AI generisanju videa prikazuje pokrete cele figure i prirodne geste. Istraživačka grupa je naglasila: “Naša glavna spoznaja je da integracija više uslovnih signala, kao što su tekst, audio i pozicija, tokom obuke može značajno smanjiti rasipanje podataka. ” Ova tehnologija označava veliki iskorak napred u medijima koje generiše AI, sa sposobnostima koje uključuju produkciju video snimaka pojedinaca koji drže govore i prikazivanje predmeta koji sviraju muzičke instrumente.

U testiranjima, OmniHuman je nadmašio postojeće sisteme u različitim metrikama kvaliteta. Dok tehnološki giganti poput Google-a, Meta-e i Microsoft-a konkuriraju u razvoju tehnologija video AI nove generacije, napredak ByteDance-a mogao bi pružiti konkurentsku prednost za njegovu matičnu kompaniju TikTok u ovom brzo evoluirajućem okruženju. Stručnjaci veruju da ova tehnologija ima potencijal da revolucionizuje proizvodnju zabave, kreiranje obrazovnog sadržaja i digitalnu komunikaciju. Međutim, takođe izaziva zabrinutost u vezi sa mogućom zloupotrebom sintetičkih medija u obmanjujuće svrhe. Istraživači planiraju da predstave svoja otkrića na predstojećoj konferenciji o računarstvu i viziji, iako još nisu objavili konkretne detalje.


Watch video about

ByteDance predstavlja OmniHuman: revolucionarni sistem za generaciju video sadržaja pomoću veštačke inteligencije.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 5:37 a.m.

Deepfake video snimci koje generiše veštačka inte…

Brzi napredak veštačke inteligencije doveo je do zapanjujućih inovacija, naročito tehnologije deepfake.

Dec. 19, 2025, 5:28 a.m.

Yann LeCun iz Metas cilja vrednost od 3,5 milijar…

Jana LeCun, priznati istraživač veštačke inteligencije i uskoro bivši glavni naučni stručnjak za AI u kompaniji Meta, pokreće revolucionarni startup za veštačku inteligenciju.

Dec. 19, 2025, 5:24 a.m.

SAD pokreću pregled prodaje naprednog Nvidia AI č…

Administracija Donalda Trampa pokrenula je sveobuhvatnu međuinstitucijsku procenu radi razmatranja odobrenja za izvoz naprednih AI čipova Nvidia H200 u Kinu, što označava značajnu promenu u odnosu na restrikcije iz ere Bidena koje su efektivno zabranile takve prodaje.

Dec. 19, 2025, 5:24 a.m.

Zašto je Božićni AI reklama McDonald'sa tako užas…

U decembru 2025.

Dec. 19, 2025, 5:21 a.m.

Revolucija AI SEO: Potreba za prilagođavanjem u e…

Digitalni marketing doživljava značajnu transformaciju koja je podstaknuta porastom veštačke inteligencije (VI) u optimizaciji pretraživača (SEO).

Dec. 18, 2025, 1:30 p.m.

Micron daje optimističnu prognozu prodaje jer veš…

Bloomberg Micron Technology Inc, najveći američki proizvođač memorijskih čipova, izdao je optimističku prognozu za tekući kvartal, navodeći da rast potražnje i nestašice snabdevanja omogućavaju kompaniji da naplaćuje više cene za svoje proizvode

Dec. 18, 2025, 1:29 p.m.

Vesti i informisanost koje vam trebaju o luksuzu

Poverenje u generativnu veštačku inteligenciju (VI) među vodećim stručnjacima za oglašavanje dostiže nerešene nivoe, prema nedavnoj studiji Boston Consulting Group (BCG).

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today