Feb. 5, 2025, 12:22 a.m.
3016

ByteDance Imetangaza OmniHuman: Mfumo wa Uzalishaji wa Video wa AI wa Kihistoria

Brief news summary

ByteDance imezindua OmniHuman, mfumo wa AI wa kipekee unaobadilisha picha za kawaida kuwa video za kuvutia na za mwingiliano zikiwa na sauti, muziki, na mwendo. Ukuaji huu unawakilisha hatua kubwa katika burudani ya kidijitali na mawasiliano, ukifanya uwezekano wa animasikoni za mwili mzima zikiwa na ishara zinazoelea, ambayo ni uboreshaji mkubwa ikilinganishwa na teknolojia za awali ambazo zilikuwa zikitazama tu harakati za uso au sehemu ya juu ya mwili. OmniHuman inatumia-seti kubwa ya data ya zaidi ya saa 18,700 za video na inatumia mbinu tata ya mafunzo ya "omni-conditions". Njia hii inachanganya data ya maandiko, sauti, na mwendo, na kusababisha matokeo ya video halisi sana na ya haraka. Uwezo wa teknolojia hii unaruhusu aina nyingi za uundaji wa maudhui, ikiwa ni pamoja na hotuba na maonyesho ya muziki, ikipata kiwango cha ubora kinachozidi mifano ya awali. Wakati washindani wakubwa kama Google, Meta, na Microsoft wakichunguza teknolojia zinazofanana, njia ya kipekee ya ByteDance inaifanya iwe katika nafasi nzuri katika uwanja huu unaokua kwa haraka. Hata hivyo, kuibuka kwa OmniHuman pia kunaleta changamoto za kimaadili kuhusu matumizi mabaya ya vyombo vya habari bandia. Timu ya utafiti inapanga kuwasilisha matokeo yao katika mkutano ujao wa kuona kompyuta, kuchangia zaidi katika mjadala unaozunguka teknolojia hii ya uvumbuzi.

Watafiti kutoka ByteDance wameunda mfumo wa AI wa kipekee unaoweza kubadilisha picha za mtu mmoja kuwa video halisi za watu wakizungumza, kuimba, na kusonga kwa ufundi—uvumbuzi huu unatarajiwa kuleta mapinduzi katika burudani za kidijitali na mawasiliano. Mfumo huu mpya, uitwao OmniHuman, unatoa video za mwili mzima zinazowaonyesha watu wakitenda na kusonga kwa usawa na hotuba zao, zikishinda vikwazo vya mifano ya zamani ya AI ambayo ilihusisha tu uso au sehemu za juu za mwili. Kufundisha OmniHuman kulihusisha saa 18, 700 za data za video ili kuwezesha usogezaji halisi. Kulingana na timu ya utafiti ya ByteDance, ambao walichapisha matokeo yao kwenye arXiv, “Kufanya animation ya binadamu kutoka mwanzo hadi mwisho kumeshuhudia maboresho makubwa katika miaka ya hivi karibuni. Hata hivyo, mbinu za sasa bado zina shida katika kupanuka kama mifano ya kueneza video kwa ujumuishi, zikichangia katika matumizi yao ya vitendo. ” Ili kuunda OmniHuman, timu ilitumia mkakati wa ubunifu unaohusisha zaidi ya saa 18, 700 za data za video za binadamu, ikichanganya pembejeo mbalimbali—maandishi, sauti, na harakati za mwili. Njia hii ya mafunzo ya “omni-conditions” inaruhusu AI kuchora kutoka kwa seti za data kubwa na anuwai zaidi kuliko mbinu za awali. Uvumbuzi huu katika uundaji wa video wa AI unadhihirisha harakati za mwili mzima na ishara za asili. Kikundi cha utafiti kilibaini, “Utuzi wetu mkuu ni kwamba kuunganisha ishara nyingi za hali, kama maandiko, sauti, na mikao, wakati wa mafunzo kunaweza kupunguza kwa kiasi kikubwa matumizi mabaya ya data. ” Teknolojia hii inaashiria hatua kubwa mbele katika vyombo vya habari vilivyotengenezwa na AI, ikiwa na uwezo wa kutoa video za watu wakitoa hotuba na kuonyesha masomo wakicheza ala za muziki.

Katika majaribio, OmniHuman ilipita mifumo iliyopo katika viwango mbalimbali vya ubora. Wataalamu wanakadiria kuwa teknolojia hii ina uwezo wa kuleta mapinduzi katika uzalishaji wa burudani, uundaji wa maudhui ya kielimu, na mawasiliano ya kidijitali. Walakini, pia inazua wasiwasi kuhusu uwezekano wa matumizi mabaya ya media bandia kwa madhumuni ya udanganyifu. Watafiti wanakusudia kuwasilisha matokeo yao katika mkutano ujao wa kuona kompyuta, ingawa bado hawajatangaza maelezo maalum.


Watch video about

ByteDance Imetangaza OmniHuman: Mfumo wa Uzalishaji wa Video wa AI wa Kihistoria

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 15, 2025, 1:26 p.m.

AI Inasababisha Mauzo Reccord ya $336.6B Katika W…

Uchambuzi wa Salesforce kuhusu kipindi cha ununuzi cha Cyber Week cha mwaka wa 2025 unaonyesha mauzo ya rejareja ya kihistoria duniani kote yafikie dola bilioni 336.6, ikiwakilisha ongezeko la asilimia 7 ikilinganishwa na mwaka uliopita.

Dec. 15, 2025, 1:24 p.m.

Tishio za Kutoweka kwa AI: Musk na Amodei Yaleta …

Maendeleo ya haraka ya akili bandia (AI) yamezua mijadala na wasiwasi mkubwa miongoni mwa wataalamu, hasa kuhusu athari zake za muda mrefu kwa binadamu.

Dec. 15, 2025, 1:21 p.m.

Jiamini Kabla Wall Street Hajaja: Hisa hii ya Uwe…

Hii ni yaliyotangazwa kwa msaada; Barchart haitoi tovuti au bidhaa zilizotajwa hapa chini.

Dec. 15, 2025, 1:16 p.m.

AlphaCode wa Google DeepMind: AI Inashindana Kati…

DeepMind ya Google hivi majuzi ilizindua mfumo wa kipekee wa AI uitwao AlphaCode, unaoonyesha mwendo wa mafanikio makubwa katika akili bandia na maendeleo ya programu.

Dec. 15, 2025, 1:15 p.m.

Mtaalamu wa SEO anayejulikana sana anaelezea kwan…

Ninakisia kwa karibu kuangalia ukuaji wa agentic SEO, nikiahidi kuwa kadri uwezo utavyoshikilia kwa miaka ijayo, mawakala watanufaisha sana tasnia hii.

Dec. 15, 2025, 1:10 p.m.

Peter Lington wa Salesforce kuhusu kuandaa data z…

Peter Lington, Naibu Rais wa Mkoa kwenye Idara ya Vita ya Salesforce, anasisitiza athari za mageuzi zitakazofanywa na teknolojia za hali ya juu katika Idara ya Vita katika kipindi cha mwaka wa tatu hadi wa tano zijazo.

Dec. 15, 2025, 9:35 a.m.

Nafasi ya Kiufundi ya Sprout Social katika Uwanja…

Sprout Social imejijengea nafasi thabiti kama mchezaji mkuu katika sekta ya usimamizi wa mitandao ya kijamii kwa kukumbatia teknolojia ya AI ya kisasa na kuunda ushirikiano wa kimkakati unaoendeleza ubunifu na kuboresha huduma zinazotolewa.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today