Deepfake


Los deepfakes (un acrónimo de " aprendizaje profundo " y "falso" [1] ) son medios sintéticos [2] en los que una persona en una imagen o video existente se reemplaza con la imagen de otra persona. Si bien el acto de falsificar contenido no es nuevo, los deepfakes aprovechan técnicas poderosas del aprendizaje automático y la inteligencia artificial para manipular o generar contenido visual y de audio con un alto potencial de engaño. [3] Los principales métodos de aprendizaje automático utilizados para crear deepfakes se basan en el aprendizaje profundo e implican el entrenamiento de arquitecturas de redes neuronales generativas , como los codificadores automáticos [3] oRedes generativas adversas (GAN). [4] [5]

Los deepfakes han atraído una gran atención por su uso en la creación de material de abuso sexual infantil, videos pornográficos de celebridades , pornografía de venganza , noticias falsas , engaños y fraude financiero . [6] [7] [8] [9] Esto ha provocado respuestas tanto de la industria como del gobierno para detectar y limitar su uso. [10] [11]

La manipulación de fotografías se desarrolló en el siglo XIX y pronto se aplicó a las películas . La tecnología mejoró constantemente durante el siglo XX y más rápidamente con el video digital .

La tecnología Deepfake ha sido desarrollada por investigadores de instituciones académicas a partir de la década de 1990, y más tarde por aficionados en comunidades en línea. [12] [13] Más recientemente, la industria ha adoptado estos métodos. [14]

La investigación académica relacionada con los deepfakes se encuentra predominantemente dentro del campo de la visión por computadora , un subcampo de la informática. [12] Uno de los primeros proyectos emblemáticos fue el programa Video Rewrite, publicado en 1997, que modificó las imágenes de video existentes de una persona hablando para representar a esa persona pronunciando las palabras contenidas en una pista de audio diferente. [15] Fue el primer sistema en automatizar completamente este tipo de reanimación facial, y lo hizo utilizando técnicas de aprendizaje automático para establecer conexiones entre los sonidos producidos por el sujeto de un video y la forma de la cara del sujeto. [15]

Los proyectos académicos contemporáneos se han centrado en la creación de videos más realistas y en la mejora de técnicas. [16] [17] El programa "Synthesizing Obama", publicado en 2017, modifica las imágenes de video del ex presidente Barack Obama para representarlo pronunciando las palabras contenidas en una pista de audio separada. [16] El proyecto enumera como principal contribución a la investigación su técnica fotorrealista para sintetizar las formas de la boca a partir del audio. [16] El programa Face2Face, publicado en 2016, modifica las imágenes de video de la cara de una persona para representarla imitando las expresiones faciales de otra persona en tiempo real. [17]El proyecto enumera como principal contribución a la investigación el primer método para recrear expresiones faciales en tiempo real utilizando una cámara que no captura la profundidad, lo que hace posible que la técnica se realice utilizando cámaras de consumo habituales. [17]


Dos ejemplos de deepfakes; aunque parecen ser imágenes de personas reales, los rostros fueron generados por computadora.
Tecnología deepfake utilizada para crear morphing facial
Video deepfake: Vladimir Putin advierte a los estadounidenses sobre la interferencia electoral y la creciente división política
La primera actriz de cine impulsada por IA: una ciber Ornella Muti del videoarte de Joseph Ayerle "Un'emozione per semper 2.0" (2018)
Reproducir medios
"Kim Jong-Un"