Penjana Video AI Google Veo 3: Menyelaraskan Audio dan Video dengan Keaslian yang Mengagumkan

Pada hari Selasa, Google memperkenalkan Veo 3, satu model sintesis video AI baharu yang mampu mencapai sesuatu yang belum pernah dilakukan oleh penghasil video AI utama sebelum ini: menghasilkan trek audio yang diselaraskan bersama video. Antara tahun 2022 dan 2024, video awal yang dijana AI adalah tanpa suara dan biasanya sangat ringkas. Kini, Veo 3 menyampaikan klip berkualiti tinggi selama lapan saat lengkap dengan suara, dialog, dan efek bunyi. Selepas pelancaran, orang ramai segera mengemukakan soalan ujian utama yang jelas: Sejauh mana Veo 3 boleh memalsukan aktor pemenang Anugerah Oscar Will Smith sedang makan spageti? Ringkasan pantas: “Ujian spageti” dalam video AI bermula pada Mac 2023 dengan satu video awal yang agak menjadikan tidak selesa, dijana AI menggunakan model sintesis sumber terbuka yang dipanggil ModelScope. Contoh spageti itu menjadi sangat terkenal sehingga Smith membuat parody video hampir setahun kemudian, iaitu pada Februari 2024. Berikut adalah pengingat bagaimana video viral asal itu kelihatan: Apa yang sering dilupakan ialah ketika itu, parody Smith tidak dihasilkan menggunakan penghasil video AI terbaik yang ada—sebuah model bernama Gen-2 dari Runway telah pun menghasilkan hasil yang lebih berkualiti tinggi, walaupun ia belum boleh diakses secara umum. Namun, versi ModelScope cukup pelik dan berkesan untuk menjadi rujukan terhadap batasan awal AI video semasa teknologi ini berkembang. Awal minggu ini, pengembang aplikasi AI, Javi Lopez, membalas kepada peminat yang ingin mengulang ujian spageti menggunakan Veo 3, berkongsi penemuan beliau di X. Namun, apabila menonton hasilnya, trek audio kelihatan luar biasa: Smith palsu itu kedengaran seperti sedang mengunyah spageti. Kegagalan ini berpunca daripada keupayaan eksperimen Veo 3 untuk menambah efek bunyi, kemungkinan besar kerana data latihan yang termasuk banyak contoh mengunyah disertai bunyi mengunyah yang berkecai. Model AI generatif berfungsi sebagai sistem ramalan yang memadankan corak, bergantung kepada data latihan yang mencukupi dalam pelbagai jenis media untuk menghasilkan output yang meyakinkan.
Apabila konsep tertentu terlalu banyak atau terlalu sedikit dalam data tersebut, ia membawa kepada kecacatan generasi yang pelik seperti ini. Kami juga mencuba arahan sendiri pada Veo 3, tetapi “Will Smith” disekat oleh penapis kandungan Google. Namun, menggunakan arahan “Lelaki kulit hitam makan spageti, ” menghasilkan kesan bunyi mengunyah yang serupa (mungkin Lopez mempunyai akses awal tanpa penapis, atau mencuba variasi arahan yang terbawa masuk). Veo 3 mengagumkan dengan keupayaannya untuk menjana dialog dan muzik yang koheren, dan sudah menginspirasi banyak contoh menarik di X. Tidak mahu berhenti di sekadar video lelaki yang sedang makan mi al dente, kami menguji sama ada figur itu boleh menyanyi dan makan serentak dengan arahan: “Seorang lelaki menyanyi opera komedi berbahasa Inggeris tentang spageti di meja dapur sambil memakannya. ” Kami telah membuat kemajuan besar sejak 2023, dan penghasil video AI akan terus memperbaiki dari segi realisme dan fungsi. Jika bukan kerana penapis selebriti semasa Veo 3, kita mungkin dengan mudah menghasilkan video Smith sedang menyanyi—atau melakukan apa sahaja yang lain—yang menunjukkan potensi kebimbangan berkaitan teknologi video AI. Singularity budaya semakin menghampiri. Sehubungan itu, kami baru-baru ini menjalankan siri ujian penjanaan video sendiri yang luas dengan Veo 3 dan akan berkongsi hasilnya tidak lama lagi dalam satu artikel khas. Buat masa ini, anggap ini sebagai kemaskini ringkas tentang The Fresh Prince of Noodletime. Selamat menikmatinya!
Brief news summary
Google telah memperkenalkan Veo 3, sebuah model sintesis video AI canggih yang mampu menghasilkan video HD berdurasi lapan saat yang disinkronkan lengkap dengan audio, dialog, dan efek bunyi—melebihi alat sebelumnya yang terhad kepada klip senyap atau sangat pendek. Dalam ujian, Veo 3 berjaya mencipta semula satu senario pensijilan dengan meniru pelakon pemenang Oscar, Will Smith, sedang makan spaghetti dari satu video berkualiti rendah 2023. Walaupun model ini menggabungkan video dan audio dengan berkesan, ia menghasilkan bunyi “crunching” yang pelik semasa adegan spaghetti, mungkin disebabkan oleh kecenderungan data latihan yang menekankan bunyi mengunyah. Penapis kandungan menghalang arahan langsung “Will Smith”, tetapi input serupa masih menyebabkan gangguan audio. Walaupun menghadapi cabaran ini, Veo 3 cemerlang dalam menghasilkan dialog dan muzik yang koheren, memberi inspirasi kepada projek kreatif seperti opera spaghetti komedi. Kemajuan ini menandakan langkah penting ke arah multimedia yang dihasilkan AI secara realistik, walaupun sekatan terhadap kemiripan selebriti terus menjadi halangan. Pelepasan Veo 3 telah mencetuskan perbincangan budaya mengenai realisme video AI dan menambah sedikit kelainan kepada kisah spaghetti “The Fresh Prince” di tengah-tengah ujian berterusan.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Perlumbaan AI Dipercepat dengan Pengumuman Teknol…
Industri kecerdasan buatan menyaksikan lonjakan luar biasa dalam perkembangan utama minggu lalu, menegaskan inovasi yang pesat dan persaingan sengit di kalangan syarikat teknologi terkemuka.

Masihkah Google dapat menguasai pencarian di era …
Pada persidangan pemaju Google 2025, syarikat itu mendedahkan satu perubahan besar terhadap fungsi carian utama mereka, menekankan peranan penting kecerdasan buatan yang akan memainkan peranan dalam masa hadapan.

Washington bergerak dengan kripto: Rang undang-un…
Dalam episod minggu ini dari Byte-Sized Insight di Decentralize bersama Cointelegraph, kami meneroka perkembangan penting dalam legislasi kripto di A

Panduan Asas Aset Digital: Mengapa Pasaran Ekuiti…
Sudah lebih 15 tahun sejak bitcoin pertama kali dicipta, dan mata wang kripto kini memenuhi sebahagian janji awalnya dengan mengubah sistem kewangan yang telah lama wujud.

Berikut adalah 6 pengajaran utama dari Google I/O…
Pada persidangan Google I/O minggu ini, gergasi teknologi itu mengumumkan kira-kira 100 pengumuman, menunjukkan hasrat mereka untuk menguasai AI di pelbagai bidang—daripada mengubahsuai Semakan hingga mengemas kini model AI dan teknologi hariwang.

Bitcoin melonjak melepasi $111,000: Perlombongan …
Bitcoin kembali menarik perhatian global selepas melepasi paras $111,000 buat kali pertama, didorong oleh pelabur institusi, perubahan dinamik monetari geopolitik, dan kebangkitan semula lonjakan crypto.

Apa Yang Difikirkan AI Akan Berlaku Dalam Kes Hak…
Trump lawan CASA dalam Pecahan AI: Mensimulasikan Pendapat Mahkamah Agung minggu lalu, Mahkamah Agung mendengar kes Trump lawan CASA, Inc