Como ya hemos dicho aquí antes, Google parece ir en todos los frentes y ahora ha comprado al empresa británica DeepMind Technologies, por unos 400 millones de libras esterlinas, una suma sin duda considerable, considerando que la empresa no ha hecho nada muy relevante, hasta ahora.
DeepMind se fundó en Londres en el 2012, por Demis Hassabis, Shane Legg y Mustafa Suleyman. El primero fue niño prodigio y se le ha involucrado en toda clase de juegos desde entonces. Trabajando para la industria de los videojuegos, Hassabis creó algunos en donde el más conocido quizás sea Theme Park. Estudio ciencias de la computación en Cambridge e hizo un doctorado en Neurociencia por la University College London, en el 2009. Su campo más conocido no tiene mucho que ver con el área de la inteligencia artificial, pues su trabajo es sobre cómo la forma en que la amnesia daña el efecto del hipocampo para poder imaginar el futuro.
Y aunque la compañía tiene muy poca presencia pública, su página dice: “DeepMind es una compañía que está en el límite de la inteligencia artificial. Combinamos las mejores técnicas, desde aprendizaje de máquinas y sistemas de neurociencia para construir poderosos algoritmos de propósito general de aprendizaje”, o bien “Nuestras primeras aplicaciones comerciales son simulaciones, comercio-e y juegos”.
Esto es lo único que se sabe sobre esta empresa. También se tiene conocimiento de que se ha contratado a graduados de los grupos de investigación en aprendizaje profundo, cuyos líderes son Hinton, Lecun, Bengio y Schmidhuber. Hinton ya había sido contratado por Google, al menos medio tiempo, y se ha enfocado a la investigación en redes neuronales profundas. Aunque todo es aún especulación, quizás Google se interesó en el trabajo de demostración de DeepMind cuando usó una red neural profunda para jugar Breakout de Atari 2600, entre otros juegos.
Lo novedoso sobre este trabajo es que no usa aprendizaje supervisado o no supervisado para entrenar la red, sino aprendizaje reforzado. La red es entrenada usando una forma modificada de aprendizaje Q, el cual parece ser la única manera válida de hacer aprendizaje reforzado en una computadora. En este caso, a la máquina no se le dice qué tan bien está haciendo las cosas, sino que se le deja para que busque por ella misma patrones en los datos y aprenda de acuerdo a las recompensas que logra durante el juego, en particular cuando éste termina con triunfos o derrotas.
La cantidad pagada por Google parece poco, pues si consideramos que pagó 3.2 millardos por un fabricante de termostatos inteligentes, esto parece una ganga. Habrá que ver si en los siguientes productos de Google empezamos a ver más inteligencia artificial incorporada.
Referencias: