Los investigadores del MIT han salido de sus laboratorios con un nuevo chip que puede dar a los dispositivos móviles la posibilidad de aprendizaje profundo. En la Conferencia Internacional de Circuitos de estado Sólido, que se llevó a cabo en esta semana en San Francisco, los científicos presentaron un nuevo chip diseñado para corres específicamente una red neuronal en un dispositivo móvil, El chip es 10 veces más eficiente que un GPU móvil, por lo que estos dispositivos móviles podrían correr algoritmos de la IA de forma local.
Vivienne Sze, una profesora asistente de ingeniería eléctrica en el MIT, del grupo que desarrolló el nuevo chip, dijo que el aprendizaje profundo podría ser útil para muchas apps móviles, incluyendo reconocimiento de objetos, habla y detección de rostros, por ejemplo. “Por el momento, las redes son muy complejas y la mayoría corren en GPUs poderosos. Uno puede imaginar si esta funcionalidad pudiese ser llevada a dispositivos como los teléfonos celulares, los cuales podrían operar sin necesidad de una conexión WiFi. Podrían correrse procesos localmente por razones de privacidad. Procesar en e teléfono evitaría la latencia producida por las transmisiones por lo que se podría reaccionar más rápidamente en ciertas aplicaciones”, indicó.
El chip diseñado tiene 168 núcleos, más o menos los que hoy en día tiene un GPU móvil. A diferencia de los GPUs, el chip contiene en cada núcleo su propia memoria y además, comprime la información antes de mandarla a cada núcleo en particular. Cada núcleo se comunica directamente con sus vecinos inmediatos cercanos, por lo que si se necesita compartir datos, no tienen que pasar por la ruta de la memoria principal.
La clave final a la eficiencia del chip es un circuito especial, que coloca las tareas entre los núcleos. En su memoria local, un núcleo necesita guardar no solamente los datos que manipulan los nodos que está simulando, sino también los datos describiendo los nodos por sí mismos. Este circuito puede ser reconfigurado para diferentes tipos de redes, distribuyendo automáticamente tanto los datos, a lo largo de los núcleos, de manera que maximice la cantidad de trabajo que cada uno de ellos puede hacer antes de tomar más datos de la memoria principal.
Eyeriss, que es el nombre del chip, fue demostrado en la conferencia con la implementación de una red neuronal que desempeña una tarea de reconocimiento de imágenes. esta es la primera vez que una red neuronal de última generación se demuestra en un chip especialmente construido para ello.
Referencias: