Областа на јазичен модел за текст до видео се развива брзо, со пробиви кои ги прошируваат можностите. Sora од OpenAI изненади со создавање на хипер-реалистични, висококвалитетни видеа од едноставни текстуални налози. Сега, ByteDance (компанијата-родител на TikTok) лансира нов конкурент: Goku, модел за генерација на видео со отворен извор. За разлика од Sora, кој е затворен извор, Goku со својот отворен дизајн има за цел демократска разовоз на AI-генерирани видеа и поттикнување на иновации преку соработка со заедницата. Да го разгледаме Goku, неговите карактеристики, како се споредува со Sora и што значи тоа за иднината на видео содржините генерирани од AI. **Што е Goku?** Goku е напреден AI модел за текст до видео кој создава кохерентни, висококвалитетни, реалистични видео клипови од описи во текст. Иако не е целосно јавен, првичните извештаи укажуваат дека е меѓу најнапредните AI генератори на видеа. **Клучни Карактеристики на Goku** - *Ректифицирана тековна форма (RF)*: Обезбедува рамномерно, кохерентно движење со избегнување на независноста на рамките, што овозможува природен проток на видеото. - *3D заеднички картинки-видео варијативен автоенкодер (VAE)*: Ја компресира сликата и видеото во заедничко латентно поле, зголемувајќи ефикасност и одржувајќи високата резолуција. - *Трансформер мрежа со целосно внимание*: Користи FlashAttention и 3D RoPE позициони embeddings за да ја восприема простор-врсканата поврзаност, создaвајќи динамични видеа со реалистично движење на објектите. - *Отворен извор*: За разлика од сопственичкиот Sora, Goku е слободно достапен, што ги поттикнува развивачите, истражувачите и ентузијастите да експериментираат и иновираат, потенцијално забрзувајќи напредок во AI видео технологијата. **Goku vs Sora: споредба** ByteDance’s Goku и OpenAI’s Sora се разликуваат главно по пристапот и пристигнувањето. Goku со својата отворена природа поканува заедниците да учествуваат во развојот, што ја намалува границата за експериментирање и брзо зголемување на напредокот. Sora останува приватен и затворен за јавноста, што ограничува експериментирањето надвор од OpenAI.
Технички, Goku ги користи Рекифицираната тековна форма, 3D заедничкиот VAE и трансформер со полно внимание, додека Sora користи дифузни модели и длабоки неврални мрежи оптимизирани за долгорочно генерирање видеа. Sora е ценет за високата реалистичност и конзистентност, но е ограничен од пристапот. Goku, кој е во рана фаза на развој, покажува потенцијал за иновативен напредок преку својот отворен модел. **Иднината на AI видео генерацијата** Появата на Goku и Sora означува почеток на револуција во AI видеата, насочена кон: - Масовно прифаќање на AI засновано создавање видеа, направено достапно и за широка публика. - Зголемување на конкуренцијата со отворен извор, што може да инспирира други и да забрза технолошки напредок. - Целосни филмови и ТВ серии создадени со AI, од сценарија до режија и анимација. - Етички предизвици како злоупотреба на deepfake, лажни вести и прашања за приватност, што бара регулатива за одговорна употреба на ИИ. **Конечни мисли: Нова ера на AI видеа** Goku од ByteDance означува значаен напредок во технологијата на AI видеото преку својот отворен модел, можеби демократизирајќи ја филмската продукција и забрзувајќи иновации во споредба со затворениот систем Sora од OpenAI. Иако е во рана фаза, потенцијалот на Goku се гледа во области како забава, образование, маркетинг и други. Како што технологијата за AI видеа се развива, од клучно значење е да се праша дали проекти со отворен извор како Goku ќе надминат приватните модели како Sora. Одговорот може да ја преобликува иднината на создавањето дигитално содржини. Следете за дополнителни новини!
ByteDance лансира Гоку: модел за отворен код за вадење текст од AI во видео, кој ја предизвикува OpenAI’s Sora
Anywhere Real Estate ја заклучи годината полна со вести со кратко извештај за приходите од третот квартал кој ја потенцира силната динамика и развојот во областта на вештачката интелигенција, додека се подготвува за идната интеграција со Compass.
Прегледите за ИИ се најновиот вжештен тренд во SEO, при што цитирањето на овие резуми на Гугл се смета за клучна мерка за успех во SEO.
Vista Social воведе значаен напредок во управувањето со социјалните мрежи со интеграција на технологијата ChatGPT во својата платформа, станувајќи првиот алат кој ја вклучува напредната разговорна вештачка интелигенција на OpenAI.
Во денешното видео ги покривам најновите случувања кои влијаат врз Astera Labs (ALAB 3,17%), Super Micro Computer (SMCI 4,93%) и различни други акции поврзани со вештачка интелигенција.
Палантир Технологии Инк.
Гугл ја лансираше својата прва ТВ реклама целосно создадена со вештачка интелигенција, означувајќи значаен чекор во мешањето на технологијата со маркетингот и рекламата.
„Победата на најдобар софтвер за пребарување со вештачка интелигенција потврдува колосалниот напор вложен во OTTO и визијата што ја делат сите во Search Atlas,“ изјави Маник Бхан, основач, извршен директор и технички директор на Search Atlas.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today