None
Brief news summary
NoneO Google Scholar Enric Corona e sua equipe desenvolveram uma ferramenta chamada VLOGGER que pode gerar vídeos de alta resolução de pessoas falando com base em uma única fotografia. A ferramenta pode animar os vídeos para retratar com precisão expressões faciais e movimentos corporais, tornando-se um "avatar" de alta fidelidade. A equipe sugere que o VLOGGER possa ter aplicações em avatares de suporte, comunicação online, educação e assistentes virtuais personalizados. No entanto, também pode haver um potencial de uso indevido para criar deepfakes ou vídeos manipulados.
O VLOGGER combina multimodalidade, modelos de linguagem grandes e técnicas de difusão para criar vídeos realistas. A equipe treinou uma rede neural para associar áudio com quadros de vídeo a fim de sincronizar os movimentos e expressões. A ferramenta pode ser personalizada ainda mais através de ajustes finos e oferece controle sobre recursos como piscar os olhos e movimentos da boca. Embora o VLOGGER forneça uma maneira de manipular vídeos de alta resolução, preocupações sobre o uso indevido potencial e a necessidade de detectar deepfakes persistem.
Watch video about
None
Try our premium solution and start getting clients — at no cost to you