Pada hari Selasa, Google meluncurkan Veo 3, sebuah model sintesis video AI baru yang mampu mencapai sesuatu yang belum pernah dilakukan oleh generator video AI besar lainnya: menghasilkan trek audio yang sinkron bersama video. Antara tahun 2022 dan 2024, video-video yang dihasilkan AI awalnya tidak bersuara dan umumnya sangat singkat. Sekarang, Veo 3 menyajikan klip berdurasi delapan detik berkualitas tinggi lengkap dengan suara, dialog, dan efek suara. Setelah peluncuran tersebut, orang-orang langsung mengajukan pertanyaan tolok ukur yang jelas: Seberapa baik Veo 3 dapat menipu aktor pemenang Oscar Will Smith yang sedang makan spageti? Sebagai ringkasan singkat: "tolok ukur spageti" dalam video AI dimulai pada Maret 2023 dengan sebuah video awal yang cukup menggelikan dan mencemaskan, yang dibuat menggunakan model sintesis sumber terbuka bernama ModelScope. Contoh spageti itu menjadi sangat terkenal sehingga Smith melakukan parodi hampir setahun kemudian, pada Februari 2024. Berikut pengingat tentang seperti apa video viral aslinya: Yang sering dilupakan adalah bahwa saat itu, parodi Smith tidak dibuat dengan generator video AI terbaik yang tersedia—sebuah model bernama Gen-2 dari Runway sudah berhasil menghasilkan hasil yang lebih berkualitas, meskipun belum dapat diakses secara publik. Namun, versi ModelScope cukup aneh dan mengesankan untuk menjadi referensi terhadap keterbatasan awal AI video saat teknologi ini berkembang. Awal minggu ini, pengembang aplikasi AI Javi Lopez merespons antusiasme penggemar yang ingin mengulangi tes spageti menggunakan Veo 3, dan membagikan temuan-temuannya di X. Namun, saat menonton hasilnya, soundtrack-nya terasa aneh: suara Smith palsu terdengar seperti dia sedang mengunyah spageti. Kecacatan ini berasal dari kapasitas eksperimen Veo 3 untuk menambahkan efek suara, kemungkinan karena data latihannya mencakup banyak contoh mengunyah yang disertai suara crunching. Model AI generatif berfungsi sebagai sistem prediksi pencocokan pola, yang bergantung pada data pelatihan yang cukup dari berbagai media untuk menghasilkan output yang meyakinkan.
Ketika konsep tertentu terlalu berlebihan atau kurang representatif dalam data tersebut, itu dapat menyebabkan artefak generasi yang aneh seperti ini. Kami juga mencoba sendiri prompt tersebut di Veo 3, tetapi "Will Smith" diblokir oleh filter konten Google. Namun, menggunakan prompt "Seorang pria kulit hitam makan spageti, " hasilnya menghasilkan efek suara crunching yang serupa (Lopez mungkin memiliki akses awal tanpa filter, atau bereksperimen dengan variasi prompt yang lolos). Veo 3 mengesankan dengan kemampuannya menghasilkan dialog dan musik yang koheren, dan sudah menginspirasi banyak contoh mencolok di X. Tidak ingin berhenti hanya di video seorang pria yang makan mie sangat al dente, kami menguji apakah figur tersebut dapat bernyanyi dan makan sekaligus dengan prompt: "Seorang pria menyanyikan opera komedi berbahasa Inggris tentang spageti di meja dapur sambil memakannya. " Kami telah mencapai kemajuan signifikan sejak 2023, dan generator video AI akan terus berkembang dalam hal realisme dan fungsionalitas. Jika bukan karena filter selebriti saat ini di Veo 3, kita mungkin dengan mudah bisa membuat video Smith sedang menyanyi—atau melakukan hampir apa saja—yang menyoroti potensi kekhawatiran terkait teknologi video AI. Singularitas budaya tengah mendekat dengan cepat. Sejalan dengan itu, baru-baru ini kami melakukan rangkaian pengujian generasi video secara ekstensif menggunakan Veo 3 dan akan membagikan hasilnya segera dalam sebuah fitur khusus. Untuk saat ini, anggap ini sebagai pembaruan singkat tentang The Fresh Prince dari dunia noodles. Selamat menikmati!
Google Veo 3 Generator Video AI: Menyinkronkan Audio dan Video dengan Realisme yang Mengagumkan
Perusahaan Walt Disney telah memulai tindakan hukum penting terhadap Google dengan mengirim surat cease-and-desist, menuduh raksasa teknologi tersebut melanggar hak cipta konten Disney selama pelatihan dan pengembangan model kecerdasan buatan (AI) generatif tanpa memberikan kompensasi.
Seiring dengan kemajuan kecerdasan buatan (AI) dan semakin terintegrasinya ke dalam pemasaran digital, pengaruhnya terhadap optimisasi mesin pencari (SEO) menjadi semakin signifikan.
MiniMax dan Zhipu AI, dua perusahaan kecerdasan buatan terkemuka, dilaporkan sedang mempersiapkan peluncuran go public di Bursa Efek Hong Kong sejak Januari tahun depan.
Denise Dresser, CEO Slack, akan meninggalkan posisinya untuk menjadi Chief Revenue Officer di OpenAI, perusahaan di balik ChatGPT.
Industri film sedang mengalami transformasi besar karena studio-studio semakin banyak mengadopsi teknik sintesis video berbasis kecerdasan buatan (AI) untuk meningkatkan alur kerja pasca-produksi.
AI merevolusi pemasaran media sosial dengan menawarkan alat-alat yang menyederhanakan dan meningkatkan keterlibatan audiens.
Munculnya influencer yang dibuat oleh AI di media sosial menunjukkan perubahan besar dalam lingkungan digital, memicu perdebatan luas tentang keaslian interaksi online dan kekhawatiran etika terkait persona virtual ini.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today