Google Veo 3 AI Видео Жасаушы: Дыбыс пен Видеоны Реалистік Синхрондау

Еъсенбі күні Google Veo 3 атты жаңа жасанды интеллект бойынша видеосын синтездеу моделін таныстырды, ол бұрын ешқандай ірі AI видео генераторы жүзеге асыра алмаған бір нәрсені – видеоға сәйкес дыбыс жолын қосу мүмкіндігін қол жеткізді. 2022 жылдан 2024 жылға дейін бастапқы жасанды интеллект көмегімен жасалған видеолар үнсіз және әдетте өте қысқа болды. Енді, Veo 3 сегіз секундтық жоғары анықтамалы клиптерді дауыс, әңгіме және дыбыс эффекттерімен толық қамтамасыз етеді. Жариялаудан кейін адамдар бірден әдеттегі сынақ сұрағын қойды: Veo 3 Oscar номинацияланған актер Уилл Смитті спагетти жеп тұрғандай етіп қалай жалғандай алады? Қысқаша қайталау: жасанды интеллект видеосындағы «спагетти сынағы» 2023 жылдың наурызында басталды, онда ModelScope деп аталатын ашық бастапқы құрамды синтез моделін пайдаланып жасалған алғашқы, әжептәуір алаңдататын видеосы пайда болды. Сол спагетти мысалы сол себепті танымал болды, ал Уилл Смит оны шамамен бір жыл кейін, 2024 жылдың ақпанында пародиялап қайталаған еді. Міне, бастапқы вирустық видеоны қалай көрінгені жөнінде еске салсақ: Көп жағдайда ұмытылатын нәрсе – сол кезде Смит пародиясы ең сапалы AI видеосы болып табылатын модель — Runway-дің Gen-2 деп аталатын моделін пайдаланып жасалған жоқ еді, ол жоғары сапалы нәтижелер әкелген, бірақ әлі қоғамдық қолжетімді болмаған. Дегенмен, ModelScope нұсқасы өзінен таңқаларлық әрі есте қаларлық болатын, жасанды интеллект видеосының шектеулерін көрсете отырып, технология дамыған сайын эталонға айналды. Осы аптада, AI қолданбасы жасаушы Хави Лопес өз жанкүйерлерінің Veo 3 қолдану арқылы спагетти сынағын қайта көргісі келгендері туралы жауап берді, өзінің нәтижелерін X желісінде бөлісті. Алайда, оның нәтижелерін көру кезінде саундтрек ерекше сезілді: жалған Смит спагетти жеп тұрғандай естілді, ауызының тұншығуы сияқты дыбыс шықты. Бұл ақау Veo 3-тің дыбыс эффектілерін қосу эксперименттік мүмкіндігінен туындап отыр, оның оқу деректерінде көптеп жесіп, жыртап жатқан дыбыстар, соның ішінде сыңғырлаған дыбыстар көп болды деп болжауға болады. Жасанды интеллект генеративті модельдері үнемі үлгіге келтіру арқылы болжау жасап, түрлі медиа түрлерінен жеткілікті оқыту деректеріне сүйенеді.
Кейбір ұғымдар тым көп немесе тым аз көрсетілген кезде, ол ерекше нәтижелердің пайда болуына әкелуі мүмкін. Біз де өзіміздің сұрауымызды Veo 3-те сынап көрдік, бірақ «Уилл Смит» сөзі Google-дың мазмұн сүзгілері арқылы бұғатталды. Алайда, «Қара адам спагетти жеп отыр» деп сұрасаңыз, ұқсас жыртылған дыбыс эффекті шықты (Лопес мүмкін бастапқыда сүзгіден бос қолжетімділікке ие болған немесе сұрау түрлерін сынау арқылы сүзгілерден өтіп кеткен болуы мүмкін). Veo 3 өзінің үйлесімді диалогтар мен музыкады генерациялау қабілетімен таң қалдырып отыр және қазірдің өзінде X желісінде көрнекі мысалдар көп пайда болуда. Бір адам өте денте қайнатылған кеспені жеп жатқан видеодан басқа, ол фигураның ән салуын және бір уақытта тамақтануын көргісі келетінбіз, яғни «Асханада отырып, кеспеге арналған ағылшын тілінде комедиялық операны айтатын, әрі жеп тұрған адам» деп сұрадық. 2023 жылдан бері айтарлықтай прогресс жасадық, әрі жасанды интеллект видеосы генераторлары әрі қарай да реализм мен функционалдылық жағынан дамуды жалғастырады. Егер қазіргі Veo 3-тің белгілі бір танымалдылық сүзгісі болмаса, біз оңай түрде Смиттің ән айтқан немесе басқа кез келген әрекет жасаған видеоларын құра алар едік, бұл AI видеотехнологиясының әлеуетті мәселерін көрсетеді. Мәдени бірегейлікке жақындап келеміз. Осыған байланысты, біз жақында Veo 3-пен кең көлемді видеосын жасау тестілеу сериясын өткіздік және жақында нәтижелермен бөлісеміз. Ал әзірге, бұл жаңарту – «Нудлз уақытының әуесқойы» деп атайтын қысқаша шолу. Ас болсын!
Brief news summary
Google Veo 3 деп аталатын озық жасанды интеллект видео синтезі моделін таныстырды, ол дыбысы, диалогы және дыбыс эффекттерімен үйлестірілген сегіз секундтық жоғары анықтамалы бейнелерді құра алады. Бұл бұрынғы құралдардан айырмашылығы — үнсіз немесе өте қысқа клиптермен шектелген. Тестерлық нәтижелерде, Veo 3 Oscar сыйлығының жеңімпазы Уилл Смиттің 2023 жылғы төмен сапалы видеодан спагетти жеп жатқан сәтін қайталай отырып, ең жоғары көрсеткішті көрсетті. Модель видео мен дыбысты тиімді синхрондағанымен, спагетти көрінісінде ерекше “қанталау” дыбысын шығарып, бұл мүмкін оқыту деректеріде қайталап жеген шуылдарды ерекше назарға алған болуы мүмкін. Контент сүзгілері “Уилл Смит” тікелей сұраныстарына кедергі келтіреді, бірақ ұқсас сұраулар әлі де дыбыс ақауларына себеп болуда. Осы қиындықтарға қарамастан, Veo 3 тұтас диалогтар мен музыка шығару бойынша жақсы нәтиже көрсетеді, мысалы, комедиялық спагетти опера сияқты шығармашылық жобаларға шабыт береді. Бұл жетістік жасанды интеллект негізіндегі мультимедиялық шынайылыққа маңызды қадам болып саналады, дегенмен, жұлдызды бейнелердің қолданылуына шектеулер әлі де кедергілер туғызуда. Veo 3-тің шығуы жасанды интеллект видео шынайылығы туралы мәдени пікірталастарды қозғап, “Жас Патша” спагетти тарихына жаңа бұрылысты қосуда, әрі тестілеу жалғасуда.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Жасанды Интеллект жарысы ірі технологиялық хабарл…
Өткен аптада жасанды интеллект саласы маңызды жетістіктермен таң қалдырды, бұл жетекші технологиялық компаниялар арасында қарқынды инновациялар мен бәсекелікті көрсетті.

Google әлі де жасанды интеллект чатботтарының дәу…
2025 жылғы Google әзірлеушілер конференциясында компания негізгі іздеу функциясын түбегейлі жаңартып, жасанды интеллектінің болашақтағы маңызды рөлін атап көрсетті.

Вашингтон криптовалютаға қарай қадам басады: Тұра…
Осы аптада Cointelegraph-тың Decentralize бөліміндегі Byte-Sized Insight бағдарламасындағы бөлімінде АҚШ крипто заңнамасындағы маңызды өзгерістер талқыланды.

Цифрлық активтер негіздері: Неліктен меншікті нар…
15 жылдан астам уақыт бұрын алғашқы bitcoin құрылғаннан бері криптовалюта өзіне уәде еткен бірқатар уәделерін орындап, ұзақ уақыт бойы қалыптасқан қаржылық жүйелерді трансформациялап жатыр.

Міне, Google I/O-дан ең маңызды 6 негізгі тұжырым…
Осы аптадағы Google I/O конференциясында tech алыптары шамамен 100 хабарландыру жасап, әртүрлі салаларда жасанды интеллектті dominate етуге ұмтылысын көрсетті — іздеу жүйесін жаңартудан бастап AI модельдерін және киетін технологияларды жаңартуға дейін.

Bitcoin $111 000-дан асып кетті: Blockchain Cloud…
Bitcoin алғаш рет 111 000 АҚШ долларынан асып, институционалды инвесторлар, геосаяси және қаржылық динамикалардың өзгеруі және крипто нарығындағы қайта жаңару әсерімен әлемнің назарын аударып отыр.

Жасанды Invoke_тің туған жері азаматығы туралы іс…
Трампқа қарсы CASA істері бойынша Судтағы жасанды интеллект сынағы: Жоғарғы соттың пікіралдарын модельдеу Өткен аптада Жоғарғы сот Трампқа қарсы CASA, Inc