lang icon En
Feb. 5, 2025, 12:22 a.m.
3090

Inilabas ng ByteDance ang OmniHuman: Isang Rebolusyonaryong Sistema para sa Paggawa ng Video gamit ang AI.

Brief news summary

Inilunsad ng ByteDance ang OmniHuman, isang makabagong sistema ng AI na nagta-transform ng mga static na imahe sa mga kaakit-akit at interaktibong video na may kasamang pagsasalita, musika, at galaw. Ang pag-unlad na ito ay kumakatawan sa isang malaking milestone sa digital na libangan at komunikasyon, na nagbibigay-daan sa full-body animations na may dynamic na galaw, na isang makabuluhang pagpapabuti kumpara sa mga nakaraang teknolohiya na tanging mga galaw ng mukha o itaas na bahagi ng katawan lamang ang naitala. Gumagamit ang OmniHuman ng isang malawak na dataset na higit sa 18,700 oras ng video at gumagamit ng isang sopistikadong "omni-conditions" na paraan ng pagsasanay. Ang pamamaraang ito ay pinagsasama ang data ng teksto, audio, at galaw, na nagreresulta sa mataas na makatotohanang at mabilis na mga output ng video. Ang kakayahang umangkop ng teknolohiya ay nagbibigay-daan sa isang malawak na hanay ng paglikha ng nilalaman, kabilang ang mga talumpati at mga musikal na pagganap, na umaabot sa isang antas ng kalidad na nalalampasan ang mga naunang modelo. Sa mga pangunahing kakumpitensya tulad ng Google, Meta, at Microsoft na nagsisiyasat sa mga katulad na teknolohiya, ang natatanging diskarte ng ByteDance ay naglalagay dito sa magandang posisyon sa mabilis na umuunlad na larangang ito. Gayunpaman, ang pag-usbong ng OmniHuman ay nagdadala rin ng mga etikal na dilemmas tungkol sa posibleng maling paggamit ng synthetic media. Plano ng research team na ipresenta ang kanilang mga natuklasan sa isang paparating na kumperensya sa computer vision, na higit pang nag-aambag sa diskurso ukol sa makabago at makabagong teknolohiyang ito.

Ang mga mananaliksik sa ByteDance ay lumikha ng isang makabagong sistema ng AI na nagko-convert ng mga indibidwal na litrato sa mga makatotohanang video ng mga tao na nagsasalita, umaawit, at kumikilos ng maayos—isang inobasyon na naglalayong baguhin ang digital na entertainment at komunikasyon. Ang bagong binuo na sistema, na tinawag na OmniHuman, ay bumubuo ng mga full-body video na nagpapakita ng mga indibidwal na kumikilos at gumagalaw kasabay ng kanilang pagsasalita, na nalampasan ang mga limitasyon ng mga naunang modelo ng AI na tanging mukha o itaas na bahagi lamang ang nagiging animated. Ang pagsasanay sa OmniHuman ay nangangailangan ng kahanga-hangang 18, 700 oras ng video data upang mapadali ang makatotohanang paggalaw. Ayon sa research team ng ByteDance, na naglathala ng kanilang mga natuklasan sa arXiv, “Ang end-to-end na human animation ay nagkaroon ng makabuluhang pag-unlad sa mga nakaraang taon. Gayunpaman, ang mga kasalukuyang pamamaraan ay nahihirapang mag-scale up bilang malawak na mga modelo ng general video generation, na naglilimita sa kanilang praktikal na aplikasyon. ” Upang malikha ang OmniHuman, ginamit ng team ang isang makabagong diskarte na kinabibilangan ng higit sa 18, 700 oras ng human video data, na pinagsasama ang iba't ibang input—teksto, audio, at body movements. Ang “omni-conditions” na pamamaraan ng pagsasanay na ito ay nagpapahintulot sa AI na kumuha mula sa mas malalaki at mas iba't ibang datasets kaysa sa mga naunang teknolohiya. Ang makabagong hakbang na ito sa AI video generation ay nagpapakita ng full-body movement at natural na gestures. Tinalakay ng research group, “Ang aming pangunahing pananaw ay ang pagsasama ng maraming conditioning signals, tulad ng teksto, audio, at pose, sa panahon ng pagsasanay ay makabuluhang makakapagbawas ng pag-aaksaya ng data. ” Ang teknolohiyang ito ay nagpapahayag ng isang malaking hakbang pasulong sa AI-generated media, na may mga kakayahang kabilang ang paggawa ng mga video ng mga indibidwal na nagbibigay ng mga talumpati at naglalarawan ng mga paksa na tumutugtog ng mga instrumentong musikal.

Sa mga pagsubok, nalampasan ng OmniHuman ang mga umiiral na sistema sa iba't ibang quality metrics. Habang ang mga tech giant tulad ng Google, Meta, at Microsoft ay nakikipagkumpitensya upang bumuo ng susunod na henerasyong teknolohiya ng video AI, ang pag-unlad ng ByteDance ay maaaring magbigay ng kompetitibong bentahe para sa kanyang parent company na TikTok sa mabilis na umuusbong na larangang ito. Naniniwala ang mga eksperto na ang teknolohiyang ito ay may potensyal na baguhin ang produksyon ng entertainment, paggawa ng educational content, at digital na komunikasyon. Gayunpaman, nagdudulot din ito ng mga alalahanin tungkol sa posibleng maling paggamit ng synthetic media para sa mapanlinlang na layunin. Nais ng mga mananaliksik na ipakita ang kanilang mga natuklasan sa isang nalalapit na kumperensya sa computer vision, bagaman hindi pa nila inihayag ang mga tiyak na detalye.


Watch video about

Inilabas ng ByteDance ang OmniHuman: Isang Rebolusyonaryong Sistema para sa Paggawa ng Video gamit ang AI.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 21, 2025, 1:44 p.m.

Mga Kagamitan sa AI para sa Pagsusuri ng Nilalama…

Ang mga plataporma ng social media ay lalong gumagamit ng artipisyal na intelihensiya (AI) upang mapabuti ang kanilang pagpapalawig sa moderation ng video content, bilang pagtugon sa pagdami ng mga video bilang pangunahing anyo ng online na komunikasyon.

Dec. 21, 2025, 1:38 p.m.

Binabalikan ng US ang kanilang mga limitasyon sa …

BALIK-PAKON NG PATakaran: Matapos ang mga taon ng pagpapatibay ng mga restriksyon, ang desisyon na payagan ang pagbebenta ng mga Nvidia H200 chips sa China ay nagpasiklab ng mga pagtutol mula sa ilan sa mga Republican.

Dec. 21, 2025, 1:38 p.m.

Ang AI ang nasa likod ng mahigit 50,000 na pagkak…

Ang mga pagtanggal ng trabaho na dulot ng artificial intelligence ay markado sa merkado ng trabaho noong 2025, kung saan ang mga malalaking kumpanya ay nag-anunsyo ng libu-libong pagtanggal ng trabaho na iniuugnay sa pag-unlad ng AI.

Dec. 21, 2025, 1:36 p.m.

Inilunsad ang Perplexity SEO Services – ANG NEWME…

Pinapalakas ng RankOS™ ang Nakikita ng Brand at Pagbanggit sa Perplexity AI at Iba pang Search Platform na Pangkatanungan Serbisyo ng Perplexity SEO Agency New York, NY, Disyembre 19, 2025 (GLOBE NEWSWIRE) — Ngayon, ipinakilala ng NEWMEDIA

Dec. 21, 2025, 1:22 p.m.

Ang family office ni Eric Schmidt ay namumuhunan …

Isang orihinal na bersyon ng artikulong ito ay lumabas sa CNBC's Inside Wealth newsletter, na isinulat ni Robert Frank, bilang isang lingguhang mapagkukunan para sa mga mahahalagang investor at mamimili.

Dec. 21, 2025, 1:21 p.m.

Pangunahing Paghahatid tungkol sa Kinabukasan ng …

Nakatuon ang mga headline sa billion-dollar na investment ng Disney sa OpenAI at nanghuhula kung bakit pinili ng Disney ang OpenAI kaysa sa Google, na kanilang kasalukuyang inuusig dahil sa diumano’y paglabag sa copyright.

Dec. 21, 2025, 9:34 a.m.

Ipinapakita ng datos mula sa Salesforce na ang AI…

Naglabas ang Salesforce ng isang detalyadong ulat tungkol sa Cyber Week shopping event noong 2025, na sinusuri ang datos mula sa mahigit 1.5 bilyong shopaholic sa buong mundo.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today