Google Veo 3 Générateur de vidéos IA : Synchronisation audio et vidéo avec un réalisme impressionnant

Le mardi, Google a dévoilé Veo 3, un nouveau modèle de synthèse vidéo par intelligence artificielle capable de réaliser ce qu’aucun générateur vidéo IA majeur n’avait réussi auparavant : produire une piste audio synchronisée avec la vidéo. Entre 2022 et 2024, les premières vidéos générées par IA étaient silencieuses et généralement très courtes. Désormais, Veo 3 fournit des clips HD de huit secondes avec voix, dialogues et effets sonores. Suite au lancement, les gens ont immédiatement posé la question évidente de référence : à quel point Veo 3 peut-il faire semblant d’être l’acteur oscarisé Will Smith en train de manger des spaghettis ? Pour faire un bref rappel : le « benchmark spaghetti » dans la vidéo IA a commencé en mars 2023 avec une première vidéo générée par IA, assez troublante, créée à l’aide d’un modèle de synthèse open source appelé ModelScope. Cet exemple de spaghetti est devenu si connu que Smith l’a parodié près d’un an plus tard, en février 2024. Voici un rappel de la vidéo virale originale : Ce qui est souvent oublié, c’est qu’à l’époque, la parodie de Smith n’a pas été réalisée avec le meilleur générateur vidéo IA disponible — un modèle appelé Gen-2 de Runway avait déjà fourni des résultats de meilleure qualité, mais il n’était pas encore accessible au public. Pourtant, la version de ModelScope était suffisamment étrange et mémorable pour devenir un point de référence pour les limites précoces de la vidéo IA alors que la technologie progressait. Plus tôt cette semaine, le développeur d’applications IA Javi Lopez a répondu à des fans impatients de revisiter le test spaghetti avec Veo 3, partageant ses résultats sur X. Cependant, en regardant les vidéos, la bande sonore semblait inhabituelle : le faux Smith semblait croquer dans ses spaghettis. Ce bug provient de la capacité expérimentale de Veo 3 à ajouter des effets sonores, probablement parce que ses données d’entraînement incluaient de nombreux exemples de mastication accompagnée de bruits de croquage. Les modèles d’IA générative fonctionnent comme des systèmes de prédiction basés sur la reconnaissance de motifs, s’appuyant sur une quantité suffisante de données d’entraînement variées. Lorsqu’un concept est sur- ou sous-représenté dans ces données, cela peut entraîner des artefacts de génération étranges, comme ici. Nous avons également testé le prompt nous-mêmes sur Veo 3, mais « Will Smith » était bloqué par le filtre de contenu de Google.
En revanche, utiliser le prompt « Un homme noir mangeant des spaghettis » a produit un effet sonore croustillant similaire (Lopez a peut-être eu un accès anticipé sans filtre ou a expérimenté avec des variations de prompts qui ont échappé au filtre). Veo 3 impressionne par sa capacité à générer des dialogues cohérents et de la musique, inspirant déjà de nombreux exemples remarquables sur X. Ne voulant pas nous limiter à une vidéo d’un homme mangeant des pâtes très al dente, nous avons testé si la figure pouvait chanter et manger en même temps en demandant : « Un homme chantant une opérette comique en anglais sur les spaghettis à une table de cuisine tout en les mangeant. » Nous avons fait d’importants progrès depuis 2023, et les générateurs de vidéo IA continueront à s’améliorer en réalisme et en fonctionnalités. Si ce n’était la limite actuelle du filtre célébrité de Veo 3, il serait facile de créer des vidéos de Smith chantant — ou faisant presque n’importe quoi — ce qui soulève d’éventuelles préoccupations liées à la technologie vidéo IA. La singularité culturelle approche à grands pas. À ce propos, nous avons récemment mené notre propre série approfondie de tests de génération vidéo avec Veo 3 et partagerons bientôt ces résultats dans un article dédié. Pour l’instant, considérez ceci comme une brève mise à jour sur le « Jeune Prince de la noodle-time ». Bon appétit !
Brief news summary
Google a lancé Veo 3, un modèle avancé de synthèse vidéo par intelligence artificielle capable de générer des vidéos HD synchronisées de huit secondes avec audio, dialogues et effets sonores — dépassant les outils précédents limités à des clips silencieux ou très courts. Lors de tests, Veo 3 a réussi à recréer un scénario de référence en reproduisant l’acteur oscarisé Will Smith mangeant des spaghetti à partir d’une vidéo de mauvaise qualité de 2023. Bien que le modèle ait efficacement synchronisé la vidéo et l’audio, il a produit un son inhabituel de « croquement » lors de la scène des spaghetti, probablement en raison de biais dans les données d’entraînement qui mettent l’accent sur les bruits de mastication. Les filtres de contenu bloquent les interactions directes avec « Will Smith », mais des entrées similaires provoquent encore des glitches audio. Malgré ces difficultés, Veo 3 excelle dans la génération de dialogues cohérents et de musique, inspirant des projets créatifs comme une opéra comique sur des spaghetti. Cette avancée représente une étape importante vers une multimédia générée par IA plus réaliste, bien que les restrictions sur l’utilisation des images de célébrités restent un obstacle. La sortie de Veo 3 a suscité des débats culturels sur le réalisme des vidéos produites par IA et apporte une nouvelle tournure à l’histoire des spaghetti du « Prince de Bel-Air » dans un contexte de tests continus.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

La course à l'intelligence artificielle s'accélèr…
L'industrie de l'intelligence artificielle a connu une semaine remarquable avec une série de développements majeurs, soulignant une innovation rapide et une concurrence féroce parmi les principales entreprises technologiques.

Google peut-il encore dominer la recherche à l’ép…
Lors de la conférence des développeurs de Google en 2025, l'entreprise a dévoilé une refonte majeure de sa fonctionnalité de recherche principale, mettant en avant le rôle crucial que l'intelligence artificielle jouera dans son avenir.

Washington avance sur la cryptomonnaie : les proj…
Dans l’épisode de cette semaine de Byte-Sized Insight sur Decentralize avec Cointelegraph, nous explorons une avancée majeure dans la législation cryptographique américaine.

Le guide des actifs numériques : Pourquoi les mar…
Il y a plus de 15 ans que le premier bitcoin a été créé, et la cryptomonnaie réalise désormais une partie de ses promesses initiales en transformant des systèmes financiers de longue date.

Voici les 6 principales leçons à retenir de Googl…
Lors de la conférence Google I/O de cette semaine, le géant de la technologie a fait une centaine d’annonces, témoignant de son ambition de dominer l’intelligence artificielle dans divers domaines — de la refonte de la recherche à la mise à jour des modèles d’IA et des technologies portables.

Bitcoin dépasse les 111 000 $ : le Cloud Mining s…
Bitcoin attire de nouveau l’attention mondiale après avoir dépassé pour la première fois 111 000 dollars, stimulé par les investisseurs institutionnels, l’évolution des dynamiques monétaires géopolitiques, et une relance de la vague cryptographique.

Que pense l'IA qu'il adviendra dans les affaires …
Trump contre CASA dans une Fournaise de l'IA : Simulation des avis de la Cour Suprême La semaine dernière, la Cour Suprême a examiné l'affaire Trump contre CASA Inc