Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

Una aplicación fantástica de las redes neuronales profundas

En los últimos años, las redes neuronales profundas han empezado a ser utilizadas con una frecuencia inusitada. La razón es clara: parece poder resolver problemas...

vangogh00

En los últimos años, las redes neuronales profundas han empezado a ser utilizadas con una frecuencia inusitada. La razón es clara: parece poder resolver problemas que con otras tecnologías simplemente no han podido solucionarse. Básicamente las redes neuronales funcionan simulando el proceso de las neuronas, las cuales -sabemos- disparan un impulso eléctrico a otras neuronas si se pasa cierto umbral. Aplicando esta idea la ciencia de la Inteligencia Artificial (IA) parece haber hallado un importante camino que pudiese llevar a una verdadera y potente IA.

En el siguiente trabajo de redes neuronales profundas, se analiza el proceso de las habilidades artísticas. Por ejemplo, en este caso se toma el estilo (o manera de pintar) de un artista y se convierte un video en ese estilo. Francamente los resultados son espectaculares. La razón de que estas redes se estén usando es que son buenas en lo que se refiere a la generalización, que es una manera simple de hablar de extrapolación. Por ejemplo, una red neuronal sencilla puede -dados los datos del consumo de gasolina mensual de un país- llegar a las conclusiones cuánta gasolina se necesitará en los siguientes años. Y ojo, este es simplemente un ejemplo trivial.

En el caso de los pintores, se puede entrenar una red neuronal de forma que modifique una imagen original (la entrada) en algo que tenga el estilo o haga referencia a un pintor particular. El resultado es que la imagen de entrada se ve como si hubiese sido pintada por el artista en cuestión.

Se dice fácil, pero el proceso es complicado porque las redes neuronales aprenden las características sobre las imágenes y no sobre el estilo. Hay una correlación entre la información del estilo de un pintor y los pixeles de sus pinturas, lo cual es una hipótesis de trabajo. Las imágenes estilizadas (por ejemplo, imágenes originales de un pintor), son la entrada de la red neuronal y sus pixeles se ajustan para minimizar la función de pérdida, que incluye esas características y mide que tan efectiva es la correlación de la imagen usada y el ejemplo del estilo. Cabe decir que el uso de esta red neuronal no aprende el estilo del artista, sino que solamente da las características que identifican su estilo.

Pero los investigadores de la Universidad de Freiburg fueron más allá: no solamente modificaron una imagen con un estilo, sino que lo hicieron con películas (o fragmentos de las mismas). Esto conlleva más complejidad al problema, porque hay que pintar cada cuadro de la película en cuestión (30 cuadros por segundo si se trata de video), y además, mantener la consistencia entre imágenes, para que no se vean saltos entre el estilo de las mismas. Eso le llaman limitaciones temporales sobre cómo las cosas cambian.

Exactamente cómo funcionan los programas que presentaron los investigadores no es algo trivial, pero puede leerse en su artículo técnico. El proceso no es rápido a pesar de que se usó una tarjeta NVidia Titan X GPU, que le tomó unos diez minutos cada cuadro de 1024×436 pixeles.

Referencias:
Artistic style transfer for videos, por Manuel Ruder, Alexey Dosovitskiy, Thomas Brox 
i-programmer 

Comentarios