Google Veo 3 AI Видео үүсгүүр: Дуу болон Видеог оновчтой, бодит мэт тохируулах чадвар

Мягмар гарагт Google шинэ AI видео үүсгэгч модел болох Veo 3-ийг танилцууллаа. Энэ модел нь өмнө олон том AI видео үүсгэгчийн хийж чадаагүй зүйл болох хувирамтгай аудио замыг видеотой нь хамт үүсгэж чадна. 2022-2024 он хүртэл AI-ээр үүсгэсэн эхний видеонууд дуугүй бөгөөд ихэвчлэн маш богинохон байв. Одоо Veo 3 нь найм секунд үргэлжлэх HD чанартай дүрслэлийг дуу, яриа, дуу effect-үүдийн хамт гаргаж байна. Галт цамхгийн эхэнд хүмүүс хамгийн тодорхой асуулт тавилаа: Veo 3 хэр сайн Оскарын шагналт жүжигчин Will Smith гоймон идэж байгаа дүрийг хуурч чадна вэ? Тэдгээрийн товч дүгнэлт: AI видео дахь "спагетти хөтөлбөр" явуулга 2023 оны гуравдугаар сард ModelScope нэртэй нээлтэт эх үүсвэрийн синтез модел ашиглан гаргасан түргэн, арай зовоосон AI үүсгэсэн видеогоор эхэлсэн. Тэр спагетти жишээ маш нэрд гарсан тул 2024 оны хоёрдугаар сарын сүүлээр Smith ч гэх дүртэй хуулбар хийж байсан. Энд анхны дэлгэрэнгүй вируслэг видео ямар харагдаж байсан тухай сануулга байна: Үерхэж мартах нь хэвийн боловч, тухайн үед Smith-ийн инээдэмийг илэрхийлэх энэ хуулбар хамгийн сайн AI видео үүсгэгч болох Gen-2 нэртэй Runway-ийн модел ашиглан бүтээгдсэн гэдгийг санадаггүй. Тэр хэдий ч ModelScope хувилбар хачин, онцлогтой байсан тул эртний AI видеог хязгаарлалтын тусам танихад ашиглагдах эхний журам болсон. Энэ долоо хоногт AI апп хөгжүүлэгч Javi Lopez X дээр фэнүүдээс спагетти туршиж үзүүлэх хүсэлтэй хариулж, өөрийн дүгнэлтээ хуваалцав. Харин үр дүнг үзэхэд, дууны хэсэг хачин санагдсан: хуурмаг Smith спагетти хэчнээн чангатаж байгааг энгийн харагдаж байв. Энэ алдаа Veo 3-ийн туршилтын дуу эффектыг нэмэх хүчин чадлаас үүдэлтэй бөгөөд, магадгүй түүний сургалтдаа маш олон ханий чимээ, чангаар хазах тооцоог агуулсан байсан нь ийм дүрслэл бий болсон шалтгаан байж магадгүй. Генератив AI моделүүд нь зураг төсөл зургийг зөв тааж, тогтмол улс төр, хүмүүс, хиймэл оюун ухааны онцлог шинж чанаруудыг харьцуулж, итгэмээр дүрслэлийг гаргадаг. Зарим ойлголт илүү эсвэл бага дүрслэгдэх тусам иймэрхүү этгээд үр дүнд хүрдэг. Мөн бид өөрсдөө Veo 3 дээр "Will Smith"-ийг оролцуулсан тодорхой команд өгч туршиж үзсэн ч Google-ийн контент шүүлтүүр энэ нэрийг хаажээ.
Харин "Хар хүн гоймон идэж байхад" гэх комманд ашиглавал ижилхэн чангарсан дуугаралт гарч байсан (магадгүй Lopez эх газрын шүүлтүүрээс хамгаалагдсан эсвэл өөр хувилбар туршсан байж болзошгүй). Veo 3 нь логик, яриа, хөгжим үүсгэх чадвараараа гайхалтай бөгөөд X платформ дээр олон сонирхолтой жишээнүүд үүсгэж байна. Архангай алдар суу, ганцаардал буюу хүн ямар ч үгийг бүхий л аялгуугаар үгүйлж чаддаг. Bид зөвхөн хүн гоймон идэж байгаа зургийг харуулчихгүйгээр, тэр хүн Англи хэл дээр спагеттигаар инээдмийн дуулалттай домог тоглож чадах эсэхийг шалгахаар шийдлээ: "Гэрийн өрөөнд суугаа хүн спагетти идэж байхдаа англи хэл дээр комеди дуулалттай операг дуулж байна. " 2023 оноос хойш бид олон шаталбар төсөл боловсруулж, AI видеог илүү бодитой, шинж чанараа нэмэгдүүлэхэд ахиц гарч байна. Veo 3-ийн одоогийн алдартай бүтээгдэхүүн болох нэрийг харахгүй бол, Smith-ийн дуу хөгжим өргөмжлөх эсвэл бараг юу ч хийж болох юм. Энэ нь AI видео технологийн өндөр хэтийн төлөвийг онцолсон нэгэн санал юм. Соёлын цор ганц байдал маань хурдтай хөдлөх хандлагатай байна. Түүнчлэн бид Veo 3-ээр олон туршилт хийж, удахгүй тусгай нийтлэлээр тэдгээр үр дүнгээ хуваалцах болно. Одоогоор энэ нь "Нүднийхээ хаан" цувралын богинохон шинэчлэлт юм. Амттан идэж байгаарай!
Brief news summary
Google Veo 3 нэртэй өндөр хөгжилтэй хиймэл оюуны видео бүтээх загварыг танилцууллаа. Энэ загвар нь аудио, яриа, чимээ шуугиантай у синхрончлолдог, найзуудтайгаа 8 секундийн өндөр нягтаршилтай HD видеог үүсгэдэг бөгөөд өмнөх төхөөрөмжүүдийн зөвхөн чимээгүй эсвэл маш богино клипнээс хэтрээгүй байсан үүргийг давж ажилласан. Туршилтаар Veo 3 амжилттай үнэлгээний сценарийг хуулбарлан бүтээсэн бөгөөд 2023 оны чанар муутай видеогоос Oscar шагналт жүжигчин Уилл Смитийн спагетти идэж буй зураг байлаа. Загвар нь видеог болон аудио нь ч сайн синхрончилж чадаж байвч, спагетти идэж буй үед хүчтэй “хрум” дуу гаргадаг байв. Энэ нь ихэвчлэн сургалтын өгөгдлийн эзлэх хандлагаас үүдэн ходоодны чимээ бөхлөж байгаатай холбоотой байж магадгүй. Агуулгын шүүлтүүрүүд нь “Уилл Смит” шууд хариулт өгөхийг хааж буй ч, ижил төстэй оролтод хөгжим болон дууны гажуудал үүсэх нь үргэлжлэн харагддаг. Гэвч эдгээр бэрхшээлүүдэд ч, Veo 3 нь уялдаатай яриа болон хөгжмийн бүтээлүүдийг сайн гаргаж чаддаг бөгөөд инээдэмтэй спагетти опера зэрэг бүтээлүүдийг санаачлах урам зориг өгдөг. Энэ ахиц дэвшил нь бодитой хиймэл оюуны мультимедиа үүсгэхэд томоохон алхам боллоо. Гэсэн хэдий ч зэвсэгт эрхийг хязгаарлах нь одоо ч тулгарч буй нэгэн бэрхшээл хэвээр байна. Veo 3-ий гаргалт нь хиймэл оюуны видеог бодит болгох соёлын яриа өрнөлийн улмаас олон тайлбар хийгдэж, “ФрешПринц” спагетти түүхийг шинэ өнцгөөс үзүүлэх шинэ ухаалаг санаануудыг нэмлээ.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Хиймэл оюуны уралдаан хурдсаж байна, томоохон тех…
Хиймэл оюун ухааны салбар өнгөрсөн долоо хоногт маш их шинэчлэлүүд тохиосон бөгөөд тэрбээр хурдтай шинэчлэлт, тэргүүлэх технологийн компаниудын өрсөлдөөнөөр онцлог байв.

Гүүгл хиймэл оюун ухааны чатботуудаас нэрлэгдэх э…
Гүүглийн 2025 оны хөгжүүлэгчдийн чуулган дээр компани өөрсдийн үндсэн хайлтын үйл ажиллагааг маш их шинэчлэн, ирээдүйд хиймэл оюун ухаан ямар чухал үүрэг гүйцэтгэх болохыг онцлов.

Вашингтон крипто чиглэлд хөдлөлөө өргөжүүлж байна…
Энэ долоо хоногийн Byte-Sized Insight оносон зөвлөгөө бөөгийн үе шаттайгаар Cointelegraph-той хамтран зөвхөн АНУ-ын крипто хууль тогтговорлын чухал шинэчлэлтийг судалж байна.

Цахим хөрөнгөгийн үндэслэн: Яагаад үнэт цаасны за…
15 жилийн тэрээр Bitcoin анх бүтээгдсэнөөс хойш болсон бөгөөд kriptocurrency одоо зарим эртний амлалтаа биелүүлж, удаан хугацаагаар хадгалагдсан санхүүгийн системүүдийг өөрчилж байна.

Энд Google I/O форумын хамгийн том 6 сорилт байна…
Энэ долоо хоногийн Google I/O чуулган дээр технологийн томоохон компани ойролцоогоор 100 ил тод мэдэгдлэл хийж, хайлтыг шинэчлэхээс эхлээд AI загварууд болон хувийн хэрэгслүүдийн технологийг шинэчлэх хүртэлх чиглэлд AI-ийг удирдах хүсэл эрмэлзлэлийг харуулсан байна.

Bitcoin үнэ $111,000-аас давж, Blockchain Cloud M…
Биткойн дахин дэлхийн анхаарлыг татаад байна, анх удаа $111,000-ыг давж, институцийн хөрөнгө оруулагчид, геополитикийн мөнгөний бодлогод саад болох зүйлс, мөн шинэ сэргэсэн крипто өсөлтөөр түлхэгдэж байна.

Хиймэл оюун ухаан төрсөн эрхийн иргэншлийн хэргүү…
Trump эсвэл CASA-ийн шүүхийн шийдвэрийг хиймэл оюун ухааны туршилтад сорьж: Дээд шүүхийн шийдвэрийг дарааллан загварчлах Өнгөрсөн долоо хоногт дээд шүүхээр Trump эсвэл CASA, Inc