Activa las notificaciones para estar al tanto de lo más nuevo en tecnología.

GaussianFace reconoce mejor rostros que los seres humanos

Por primera vez un programa de reconocimiento de rostros lo hace mejor que los humanos cuando se trata de reconocer dos fotos de una misma...

faces00

Por primera vez un programa de reconocimiento de rostros lo hace mejor que los humanos cuando se trata de reconocer dos fotos de una misma persona. De hecho, esto es asombroso, porque los seres humanos ya sabemos -de alguna manera- cómo reconocer caras, aunque éstas no se presenten de frente o en una situación determinada. Ahora un programa puede hacer esta tarea mejor que nosotros. Se le muestran dos rostros y el programa dice si son de la misma persona o no.

El sistema de inteligencia artificial, diseñado por los chinos de Hong Kong, Chaochao Lu y Xiaoou Tang, para clasificar imágenes dadas en un amplio conjunto (etiquetadas como “Faces in the Wild – LFW), en donde hay una amplia variedad de condiciones de luz, de posiciones de los rostros, etcétera,  aprende de conjuntos de fotografías.

Quizás si nos remontamos a otros esfuerzos parecidos, uno esperaría que el enfoque asociado a este tipo de problemas sería el usar redes neuronales profundas, pero no es el caso que nos ocvupa. Ahora se utiliza un sistema que aprende. El primer paso no se explica, pero después de esto, las fotos de los rostros en entrenamiento y prueba se normalizan vía una transformación que toca cinco puntos del rostro en particular: dos ojos, una nariz y las esquinas de la boca, dentro de una imagen de 150×120 pixeles. la imagen se divide entonces en subimágenes que se sobreponen, de 25×25 pixeles y un LBP – Local Binary Pattern, es extraído. Esto es lo que se alimenta a la computadora que va aprendiendo.

El sistema de aprendizaje de la computadora se basa en una técnica modificada de la discriminación clásica de Fisher, llamado específicamente Kernel Fisher Discriminant Analysis. (KFDA). Los investigadores inventaron además una forma más eficiente de análisis, llamada Discriminant Gaussian Latent Variable Model,  el cual se denomina GaussianFace en aras de la brevedad.

Después de esto, muchos datos se usan para entrenar a sus clasificadores y extractores de datos. El KFDA intenta encontrar características compuestas las cuales separa para usarlas en la clasificación de datos. El conjunto de dastos para entrenar es grandde: 20, 000 imágenes ya clasificadas y 20,000 sin clasificiar. Lo más importante es que se tienen diferentes conjuntos con una amplia variación en la distribución de características.

El resultado mostró que el nuevo método no sólo sobrepasa los métodos anteriores de verificación, sino que además bate el desempeño humano en este aspecto por casi un punto porcentual. Hay que recordar que  la tarea es decir si dos fotos son de la misma persona o no. Cabe señalar que si se muestra parte del cuerpo en las fotos, los seres humanos son mejores que las máquinas por unos 6 décimas de punto porcentual.

Lo que resulta interesante sobre este resultado es que el método está basado en el análisis clásico de discriminación además de algunas extensiones interesantes (e inteligentes), que permiten trabajar sobre optimizaciones no lineales para hacer mejor el desempeño. Está claro que la cantidad de datos es muy importante para el desempeño del software.

Sin embargo, al final del artículo, los investigadores notan que el entrenamiento es muy lento y que quizás sea necesario extender la técnica para ser usada con GPUs para hacerla más rápida e incluso, usando paralelismo.

Referencias:

Arxiv (pdf)

Comentarios