None
Brief news summary
NoneGoogle Scholar Enric Corona und sein Team haben ein Tool namens VLOGGER entwickelt, das hochauflösende Videos von sprechenden Personen basierend auf einem einzelnen Foto generieren kann. Das Tool kann die Videos animieren, um Gesichtsausdrücke und Körperbewegungen genau darzustellen und somit einen hochwertigen "Avatar" zu schaffen. Das Team schlägt vor, dass VLOGGER Anwendungen in den Bereichen Helpdesk-Avatare, Online-Kommunikation, Bildung und personalisierte virtuelle Assistenten haben könnte. Es besteht jedoch auch das potenzielle Risiko des Missbrauchs zur Erstellung von Deepfakes oder manipulierten Videos.
VLOGGER kombiniert Multimodalität, große Sprachmodelle und Diffusionstechniken, um realistische Videos zu erstellen. Das Team hat ein neuronales Netzwerk trainiert, um Audio mit Videoframes zu verknüpfen und somit die Bewegungen und Ausdrücke zu synchronisieren. Das Tool kann weiter personalisiert werden und bietet Kontrolle über Eigenschaften wie Augenzwinkern und Mundbewegungen. Obwohl VLOGGER eine Möglichkeit bietet, hochauflösende Videos zu manipulieren, bleiben Bedenken hinsichtlich des möglichen Missbrauchs und der Notwendigkeit der Erkennung von Deepfakes bestehen.
Watch video about
None
Try our premium solution and start getting clients — at no cost to you