lang icon English
Nov. 4, 2025, 5:28 a.m.
339

ByteDance lansira Goku: model otvorenog koda za AI prevedenu u video, koji izaziva OpenAI-jev Soru

Brief news summary

Područje AI pristupa kreiranju videa putem teksta brzo se razvija, što pokazuju Sora od OpenAI i Goku od ByteDance-a. Sora generiše hiperrealistične video snimke iz teksta koristeći napredne difuzione modele, postižući visok vizuelni kvalitet i glatke pokrete, iako je i dalje vlasnički i manje dostupan. S druge strane, Goku je model otvorenog koda koji podstiče demokratizaciju AI generisanja videa kroz saradnju zajednice. Koristi inovativne metode kao što su Rectified Flow za fluidne pokrete, 3D zajednički slika-video variacioni autoenkoder za očuvanje detalja i Transformer mrežu sa punom pažnjom za hvatanje složenih prostorno-vremenskih dinamika. Dok Sora prednjači u vizuelnoj verodostojnosti, otvorena priroda Goku-a ubrzava inovacije kroz kolektivne doprinose. Zajedno, oni ukazuju na budućnost u kojoj će AI-generisani video snimci postajati uobičajeni u filmu, marketingu i obrazovanju, uprkos etičkim izazovima i problemima lažnih sadržaja. Goku od ByteDance-a ističe trend ka dostupnoj, saradničkoj AI-driven digitalnoj kreaciji sadržaja.

Područje AI pretvaranja teksta u video brzo napreduje, sa probojima koji šire mogućnosti. Sora od OpenAI oduševila je publiku generišući hiperrealistične, visokokvalitetne video zapise od jednostavnih tekstualnih uputstava. Sada je ByteDance (majka kompanije TikTok) lansirala novog takmičara: Goku, model za generisanje videa baziran na veštačkoj inteligenciji koji je otvorenog koda. Za razliku od zatvorenog源 Sora, Goku-ov dizajn otvorenog koda ima za cilj demokratizaciju kreiranja videa pomoću AI i podsticanje inovacija kroz saradnju zajednice. Hajde da istražimo karakteristike Goku-a, kako se on poredi sa Sora-om i kakve su posledice za budućnost AI-generisanog videa. **Šta je Goku?** Goku je vrhunski AI model za pretvaranje teksta u video koji kreira koherentne, visokokvalitetne i realistične video isječke iz opisnih tekstova. Iako još nije potpuno javno dostupan, rani izveštaji ukazuju da je među najnaprednijim AI generatorima videa. **Ključne karakteristike Goku-a** - *Razvijena formulacija Rectified Flow (RF)*: Osigurava glatko, dosledno kretanje izbegavajući nezavisnost frejmova koja je česta kod tradicionalnih modela, omogućavajući prirodniji tok videa. - *3D zajednički autoenkoder (VAE) za slike i video koje koristi variacije*: Kompresuje slike i video zapise u zajednički latentni prostor, povećavajući efikasnost i održavajući visokokvalitetne detalje. - *Transformerska mreža sa punim pažnjom (full attention)*: Koristi FlashAttention i 3D RoPE pozicione prikaze za hvatanje prostorno-vremenskih odnosa, stvarajući dinamične videozapise sa realističnim kretanjem objekata. - *Otvoreni kod*: Za razliku od vlasničkog Sora, Goku-ova dostupnost otvorenog koda podstiče programere, istraživače i entuzijaste na eksperimentisanje i inovacije, što potencijalno ubrzava razvoj AI videa. **Goku vs Sora: poređenje** Goku od ByteDance i Sora od OpenAI razlikuju se uglavnom u pristupu i dostupnosti. Goku-ova otvorenost poziva zajednicu na razvoj i širu primenu, što ubrzava napredak.

Sora ostaje vlasnički i zatvoren sistem, čime ograničava eksperimentisanje van OpenAI. Tehnički gledano, Goku koristi Rectified Flow, 3D VAE za slike i video, i transformere sa punom pažnjom, dok Sora koristi difuzione modele i duboke neuronske mreže optimizovane za dugoročno generisanje videa. Sora je hvaljena zbog visokorealističnog i doslednog izlaza, ali je ograničena zbog pristupa. Goku, iako je još u ranoj fazi razvoja, pokazuje potencijal za inovacije kroz otvorenost. **Budućnost AI generisanja videa** Pojava Goku-a i Sora označava početak AI revolucije u videu, koja vodi ka: - Masovnoj produkciji visokokvalitetnog AI videa dostupnog široj publici. - Povećanoj konkurenciji open-source projekata, jer pristup ByteDance-a može inspirisati druge, ubrzavajući tehnološki napredak. - Potpuno AI-generisanim filmovima i TV-serijama, gde AI piše scenario, režira i animira. - Etičkim izazovima, uključujući zloupotrebu deepfake tehnologije, dezinformacije i probleme zaštite privatnosti, što zahteva regulative za odgovornu upotrebu AI. **Zaključak: Nova era AI videa** Goku od ByteDance-a predstavlja značajan skok u tehnologiji AI videa kroz svoj model otvorenog koda, što potencijalno demokratizuje filmsku produkciju pomoću AI i ubrzava inovacije u odnosu na zatvoreni sistem Sora od OpenAI. Iako je još u razvoju, Goku-ov potencijal u domenu zabave, obrazovanja, marketinga i šire je ogroman. Kako se tehnologija AI videa bude razvijala, ključno pitanje ostaje: da li će projekti otvorenog koda poput Goku-a nadmašiti vlasničke modele poput Sora?Odgovor bi mogao redefinisati budućnost kreiranja digitalnog sadržaja. Pratite nas za najnovije informacije!


Watch video about

ByteDance lansira Goku: model otvorenog koda za AI prevedenu u video, koji izaziva OpenAI-jev Soru

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 4, 2025, 1:22 p.m.

Nvidia-ov AI čip pokreće konzole sleće generacije…

Nvidia je predstavio svoj najnoviji AI čipset, koji će postati osnovni deo next-gen gejming konzola.

Nov. 4, 2025, 1:18 p.m.

Нови SkyReels званично лансиран

Objašnjenje o pristupačnosti Navigacija preskočiti SkyReels integriše vodeće multimodalne KI- modele kao što su Google VEO 3

Nov. 4, 2025, 1:17 p.m.

Bilo gde se fokusira na rast, dok se spajanje AI …

Anywhere Real Estate zaključio je godinu punu vesti sa kratkim izvještajem o zaradama za treći kvartal koji je pokazao snažan zamah i razvoj u oblasti veštačke inteligencije, dok se priprema za buduću integraciju sa Compass-om.

Nov. 4, 2025, 1:13 p.m.

Preispitivanje YouTube SEO: Osvojiti vidljivost u…

Pregledi veštačke inteligencije su najnoviji trend u SEO svetu, pri čemu smatrano citiranje ovih sažetaka na Google-u ključnim merilom uspeha u SEO-u.

Nov. 4, 2025, 1:09 p.m.

Vista Social uvodi ChatGPT tehnologiju, postajući…

Vista Social je predstavio značajno unapređenje u upravljanju društvenim mrežama integracijom ChatGPT tehnologije u svoju platformu, čime je postao prvi alat koji uključuje naprednu konverzacionu veštačku inteligenciju kompanije OpenAI.

Nov. 4, 2025, 1:09 p.m.

Ove 4 AI akcije će ove nedelje promeniti tržište …

U današnjem videu pokrivam najnoviji razvoj događaja koji utiču na Astera Labs (ALAB 3,17%), Super Micro Computer (SMCI 4,93%) i razne druge akcije povezane sa veštačkom inteligencijom.

Nov. 4, 2025, 9:30 a.m.

Palantir prikazuje zabrinutost oko procene vredno…

Palantir Technologies Inc.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today