Өткен жыл ішінде AI-мен жасалған видео тарату модельдері визуалды шынайылықта айрықша жетістіктерге жетті, оның дәлелі ретінде OpenAI-дің Sora 2, Google-дың Veo 3, және Runway Gen-4 сияқты модельдер көрсетілген. AI видео өндірісі маңызды кезеңге өтіп келеді, ең соңғы модельдер таңдандыратын әрі өміршең видеоклиптер жасай алуда. Алайда, бұл модельдердің архитектуралары олардың нақты уақытта интерактивті қолдануға шектеу қойып отыр, себебі олар видео кадрларын бірінен соң бірін күрделі, есептеуге ауыр кезеңдер арқылы жарататындықтан. Әрбір бөлікті өңдеу келесі бөлімге өтпестен бұрын кешігуді туындатып, тікелей AI видео ағымын қиындатады. Көптеген AI мамандары бейнектерді кейін көріп алу үшін шығаруға назар аударады, ал тікелей және бірден AI видео трансформациясы әлі бірнеше жылдардан кейін жүзеге асырылатын әлеуеті бар әлеуетті бағыт ретінде саналады. Decart командасы бұл архитектуралық тосқауылды бұзып, LSD v2 моделін әзірледі. Бұл модель жаңа әдістер арқылы минималды кешігуге қол жеткізуге болатынын көрсетті, ол әртүрлі AI модельдеріне қолдануға мүмкіндік береді. Олар инфрақұрылымды оңтайландырып, GPU-ның толық пайдалануын қамтамасыз етуге, сонымен қатар қателердің жиналуына жол бермейтін шуды жою процесін жылдамдатты. LSD v2 себептік, автормалы архитектураны пайдаланып, видеоны біртіндеп әрі үздіксіз жаратуды қамтамасыз етеді, ол шығару ұзақтығына шек қоймайды. Негізгі жаңалықтар мыналар: 1. **Себептік, автормалы моделдер арқылы шексіз өндіру** Ағыны үздіксіз бейне таратуды қамтамасыз ету үшін, видео модельдер «себептік» жұмыс істеуі қажет, яғни әрбір қисынды кадр тек алдыңғы кадрлер негізінде ғана пайда болады, бұл есептеу жүктемесін азайтады. Бұл тәсіл үздіксіздікті қамтамасыз етеді, бірақ уақыт өте келе қателер жиналып, кішкентай қателіктер, мысалы, көлеңкенің орынсыз орналасуы, бұрмалана бастайды, бұл көбінесе модельдердің қысқа видеолар жасауына әкеледі. Бұған қарсы тұру үшін Decart «diffusion forcing»-ты жетілдірді, яғни кадрларды жаратқан кезде олардың шуды жоюын жақсартты және «тарихты арттыру» әдісін еңгізді, яғни модельдер бұзылған нәтижелерді тануға және түзетуге үйретілді. Себептік кері байланыс циклында бұрынғы алынған кадрлер, ағымдағы кіріс және пайдаланушы нұсқаулары ескеріле отырып, модель артефактілерін анықтап, түзете алады және жоғары сапалы контентті шексіз шығаруға мүмкіндік береді. Бұл пайдалану кезінде нақты уақыттағы түзетулер мен өңдеуге мүмкіндік береді. 2. **GPU-ны оңтайландыру арқылы бір секундтан аз кешігуді жүзеге асыру** Нақты уақыттық интерактивті AI видео әр кадрды 40 миллисекунд ішінде шығару керек, әйтпесе айқын кешігу байқалады.
Алайда, себептік AI модельдерінің жоғары есептеу қажеттілігі қазіргі заманғы GPU-лардың дизайнымен үйлеспейді, олар көбінесе үлкен пакеттермен жұмыс істейді, ал кіші пакеттермен аз бірақ жиі жұмыс істеу кешігуді арттырады. Decart Nvidia-ның Hopper GPU-ларының функцияларын терең оңтайландырды. Көптеген кіші ядролардың орнына, жиі тоқтап, деректерді ауыстыру және уақытты босқа өткізу орнына, олар барлық есептеулерді бір үздіксіз өтуде іске асыратын бір «мега ядро» жасап шығарды. Бұл тәсіл GPU-ның толық пайдалануын айтарлықтай арттырып, өңдеуді бір ретке келтіреді, бұл Фордтың тізбектелген жұмыс процесін оңайлатқан өндіріс желісін революциялауға ұқсайды. 3. **Қысқарту және қысқа жолды тұндырлы әдістер арқылы тиімділікті арттыру** Нейронды желілер көбінесе артық параметрлермен жабдықталған, яғни қажетті нәтижеге жету үшін қажет емес көптеген параметрлер бар. Decart «архитектураға саналы қию» әдісін қолдана отырып, артық параметрлерді алып тастаған, есептеу жүктемесін азайтып, модельдерді аппараттық құрылымға жақындастырды. Сонымен қатар, олар «қысқа жолды тұндыру» әдісін ойлап тапты, ол кішірек, жеңіл модельдерді өңдеу жылдамдығын көбейтетін әрі қуатты көп тұтынатын үлкен модельдер деңгейінде оңтайландырды. Бұл қысқа жолды модельдер қолдану арқылы кадрларды біртіндеп шығару қадамдарын қысқартып, қосымша уақытта үнемдеуге және жалпы өнімділікті жылдамдатуға мүмкіндік береді. Осы жетістіктердің бәрі бірлесе отырып, субсекундтық кешігумен видео жасауға мүмкіндік берді, бұл бұрын мүмкін болмаған интерактивті AI видео қолданбаларына жол ашты. Пайдаланушылар мазмұнды бірқалыпты өңдей алады, тікелей нұсқауларға немесе аудиторияның сұранысына негізделген видеоларды түзете алады. Бұл мүмкіндік ақпарат таратушылар мен Twitch стримерлеріне қызықты болашақ ұсынады, олар эфир барысында мазмұнын динамикалы түрде өзгерте алады. Ойын-сауықтан тыс, бұл технология тірі видеоиграндарға да әсер етеді, онда AI-мен генерацияланған үзінділер ойыншының таңдауларына сәйкес динамикалық түрде бейімделе алады — мысалы, тармақталған әңгімелер, пайдаланушы шешімдеріне байланысты дамитын сюжеттер. Сондай-ақ, бұл кеңейтілген шындық, қимылдамды білім беру және үлкен оқиғалар маркетингі салаларына әсер етеді. Сонымен қатар, AI-мен жасалған видеолар архитекторлар мен интерьер дизайнерлері сияқты мамандар үшін нейронды рендеринг қозғалтқыштары ретінде қызмет етіп, стильдер мен тақырыптарды тезірек прототиптеуге, соңында жобаларды аяқтауға мүмкіндік береді. Ең таңғаларлығы, кешігуін жойып, шексіз видео жасай алу мүмкіндігі — жасампаздарға ұзақ әрі ұзақ форматтағы мазмұнды интерактивті түрде зерттеуге жол ашты. Олар сахналау, жарықтандыру, камера бұрыштарын және кейіпкерлердің эмоцияларындағы өзгерістерді нақты уақытта басқаруға мүмкіндік алады, бұл бұрын тек сценарий ретінде көрінетін оқиғаларды динамикалық, пайдаланушы-тәуелді тәжірибеге айналдырады. Decart AI компаниясының негізін қалаушы және Сан-Францискодағы бөлімінің жетекшісі Кфир Аберман нақты уақыттағы жасанды видео өндірісін зерттеуді өнімдер шығару бағытында жүзеге асыруда көшбасшы ретінде жұмыс істеп келеді. Оның жұмысы зерттеу жетістіктерін шығармашылық қолданушылар тәжірибесімен ұштастырған интерактивті, жеке AI жүйелерін құруға бағытталған.
Decart AI-дің LSD v2 жаңалығы нақты уақыттағы, төмен кешігумен жасалатын AI видеосын жасауға мүмкіндік береді
Meta-ның Жасанды Интеллект зерттеу зертханасы жақында компьютерлік көрініс саласындағы маңызды жетістікті жариялады, бұл объектілерді тану технологиясында келешекке үміттендірерлік қадам екенін көрсетеді.
Brightcove — жаһандық бұлттық контент қызметтері ұсынушы көшбасшы компания — жаһандық ауқымды кеңейту, аудиторияның ынтымақтастығын арттыру, тікелей трансляция сапасын жақсарту және видеопроцестерді жеңілдетуге арналған жеті жаңа функцияны іске қосты.
Жасанды интеллект (ЖИ) іздеу жүйесін оңтайландыру саласын тез өзгертіп жатқандықтан, ол мазмұнды бағалау тәсілдеріне де маңызды әсер етеді және маркетологтардың стратегияларын жоспарлауда негізгі элементке айналды.
Бұл жылы жасанды интеллект (ЖИ) технологияларының тез дамуы бірнеше салада сұраныстың айтарлықтай өсуіне әкелді, әсіресе мыс сымығи жабындар өндірісіне әсер етті.
Mondelēz International, Oreo, Chips Ahoy!, Ritz және Perfect Bar брендтерінің өндірушісі, AIDA (AI + Data) деп аталатын генеративтік жасанды интеллект құралын дамытты, ол жарнама бағытын жеке дараландыру мен тұтынушыларды тартуды арттыруға бағытталған.
Microsoft белгілі бір жасанды интеллект (AI) өнімдері бойынша сатылым өсуіне арналған мақсаттарынан айырылып, сол өнімдердің сатушылар тобының көпшілігі маусым айында аяқталған қаржылық жылы өз мақсаттарына жете алмағаны туралы ақпарат жарияланды.
Жасанды интеллект маркетинг саласын тезінен қайта құрып жатыр, жаңа құралдар, көзқарастар мен мүмкіндіктер ұсына отырып, бизнеске аудиториямен тиімдірек байланысуға көмектеседі.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today