lang icon En
Feb. 5, 2025, 12:22 a.m.
3061

ByteDance kynnti OmniHuman: Ítalska AI myndbandagerðar kerfi.

Brief news summary

ByteDance hefur komið á fót OmniHuman, byltingarkenndri AI kerfi sem breytir kyrrstæðum myndum í fangaðar, gagnvirkar myndbönd með tali, tónlist og hreyfingu. Þessi framfarir tákna stórt áfanga í stafrænu afþreyingu og samskiptum, sem gerir mögulegt að búa til heildarhreyfingar með dýnamískum handahreyfingum, sem er veruleg bæting miðað við fyrri tækni sem fangaði aðeins andlitshreyfingar eða efri líkama. OmniHuman nýtir umfangsmikinn gagnasafn sem inniheldur meira en 18,700 klukkustundir af myndböndum og notar flókna "omni-conditions" þjálfunaraðferð. Þessi aðferð sameinar texta, hljóð og hreyfingargögn, sem leiðir til afar raunsæis og hraðra myndbandaúttaka. Tæknin er fjölhæf og leyfir breitt úrval efnisgerð, þar á meðal ræður og tónlistarfremd, og nær gæðastigi sem fer umfram fyrri fyrirmyndir. Með stórum keppinautum eins og Google, Meta og Microsoft sem kanna svipaðar tækni, er einstök nálgun ByteDance vel staðsett á þessu hratt þróandi sviði. Hins vegar vekur uppgangur OmniHuman einnig siðferðilegar spurningar um mögulega misnotkun á tilbúnum miðlum. Rannsóknarteymið áætlar að kynna niðurstöður sínar á komandi ráðstefnu um tölvusjón, sem bætir enn frekar í umræðu um þessa nýstárlegu tækni.

Rannsóknarhópur hjá ByteDance hefur þróað byltingarkennda gervigreindarkerfi sem breytir einstaklings ljósmyndum í raunsæja myndbönd af fólki sem talar, syngur og hreyfir sig lífvana—nýjung sem hefur möguleika á að umbreyta raftengdum afþreyingum og samskiptum. Það nýlega þróaða kerfi, kallað OmniHuman, framleiðir heildar líkamsmyndbönd sem sýna einstaklinga gera merkjamyndir og hreyfa sig í samhljóm við tal þeirra, og yfirvinnur takmarkanir fyrri gervigreindarmódela sem aðeins hreyfðu andlit eða efri líkamann. Þjálfun OmniHuman fól í sér impraðandi 18, 700 klukkustundir af myndbandagögnum til að auðvelda raunsæjar hreyfingar. Samkvæmt rannsóknarhópi ByteDance, sem birti niðurstöður sínar á arXiv, "Hefur end-to-end mannsmyndaþjálfun séð verulegar framfarir á síðustu árum. Engu að síður, glíma núverandi aðferðir enn við að stækka sem umfangsmiklar almennar myndbandasköpunarmódela, sem takmarkar hagnýtingu þeirra. " Til að búa til OmniHuman nýtti hópurinn nýstárlegt fyrirkomulag sem felur í sér yfir 18, 700 klukkustundir af mannlegum myndböndum, samþættandi ýmis inntök—texta, hljóð og líkamsþrif. Þetta "omni-skilyrðingar" þjálfunaraðferð gerir gervigreindinni kleift að draga úr miklu stærri og fjölbreyttari gagnasöfnum en fyrri tækni. Þetta byltingarkennda tækni í gervigreindarmyndbandasköpun sýnir heildar hreyfingar og náttúrulegar merkjamyndir. Rannsóknarhópurinn tók fram: "Helsta innsýn okkar er að samþætting margra skilyrðinga, svo sem texta, hljóðs og líkamsstöðu, í þjálfun getur merkilega dregið úr gagnasóun. " Þessi tækni táknar stórt skref fram á við í gervigreindarskapaðri miðlun, með getu til að framleiða myndbönd af einstaklingum sem flytja ræður og sýna viðfangsefni spila músík tól.

Í tilraunum fór OmniHuman fram úr núverandi kerfum í ýmsum gæðametrik. Með því að tæknirisar eins og Google, Meta og Microsoft keppa um að þróa næstu kynslóðina af myndbandagervigreindartækni, gæti framfarir ByteDance veitt samkeppnisforskot fyrir TikTok móðurfyrirtæki þess á þessu fljótar þróunar sviði. Sérfræðingar telja að þessi tækni hafi möguleika á að umbreyta framleiðslu á afþreyingu, sköpun fræðsluefnis og rafrænum samskiptum. Hins vegar vekur það einnig upp áhyggjur um mögulega misnotkun á sýndar miðlun í blekkingaskyni. Rannsakendur hyggjast kynna niðurstöður sínar á komandi ráðstefnu um tölvusjón, þó að þeir hafi enn ekki tilkynnt sérstök úrræði.


Watch video about

ByteDance kynnti OmniHuman: Ítalska AI myndbandagerðar kerfi.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 9:32 a.m.

Markaðssetningarfyrirkomulag: Hvernig Amazon-selj…

Opinber leiðbeining Amazon um að hámarka tilvísanir á vörum fyrir Rufus, skynvæddan verslunarhjálp, eru óbreyttar og ný ráð frá fyrirtækinu hafa ekki verið veitt.

Dec. 19, 2025, 9:25 a.m.

Adobe التعاون við Runway til að færa AI-video fra…

Adobe hefur tilkynnt samstarf sem varir yfir mörg ár með Runway þar sem innleiða á eðlisrænar myndbandshæfileika beint inn í Adobe Firefly og minnkandi, dýpri innan Creative Cloud.

Dec. 19, 2025, 9:21 a.m.

Anthropic stefnir á að gæta vinnuumhverfis-Gervig…

Anthropic, leiðandi í þróun gervigreindar, hefur kynnt ný verkfæri sem ætlað er að hjálpa fyrirtækjum að innleiða gervigreind á auðveldan hátt í vinnuumhverfi þeirra.

Dec. 19, 2025, 9:14 a.m.

Insightly samþættir gervigreind í CRM vettvang

Insightly, framúrskarandi stýrikerfi fyrir viðskiptavini (CRM), hefur kynnt "Copilot", gervigreindarbot til aðstoðar sem samþættir generatív gervigreind inn í kerfið sitt til að auka afkastagetu notenda og einfalda stjórnun CRM.

Dec. 19, 2025, 9:14 a.m.

Qwen kynnti nýja AI Mini-Leiklistaraðgerð

Qwen, frumkvöðull leiðandi í gervigreindartækni, hefur kynnt nýju AI Mini-Theater eiginleikann, sem markar mikilvægt skref fram á við í notendaupplifunum sem byggja á gervigreind.

Dec. 19, 2025, 5:37 a.m.

Vélrænt framleidd djúpfake-myndbönd skapa nýjar á…

Hröð þróun gervigreindar hefur leitt til merkilegra nýjungar, sérstaklega djúpvís CDN-tækni.

Dec. 19, 2025, 5:28 a.m.

Yann LeCun hjá Meta stefnir á 3,5 milljarða dolla…

Yann LeCun, þekktur rannsóknarmaður á sviði gervigreindar og fyrrverandi yfirlæknir gervigreindar hjá Meta, ætlar að hefja byltingarkennd tækni fyrirtæki á sviði gervigreindar.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today