¿Por qué las computadoras no pueden ver la Tierra desde una distancia de kilómetros y automáticamente dibujar los mapas de las calles y las construcciones?
El operador satelital, DigitalGlobe, está creando un equipo junto con Amazon, patrocinado por la CIA y el fabricante de chips gráficos NVIDIA, para hacer que esto suceda.
En este proyecto conjunto, DigitalGlobe ha liberado una serie de imágenes satelitales que muestran prácticamente a todo Río de Janeiro a una resolución de 50 centímetros; es decir, cada pixel son 50 centímetros cuadrados físicos.
Hay un bosquejo de 200,000 edificios y construcciones en más o menos unos 1,900 kilómetros cuadrados, los cuales han sido marcados manualmente en las fotos. El conjunto de imágenes, llamado SpaceNet, busca iniciar los esfuerzos para entrenar a las computadoras para poder interpretar las fotografías satelitales de forma que puedan usar algoritmos de aprendizaje para ello.
DigitalGlobe ha indicado que los datos de SpaceNet podrían eventualmente incluir imágenes de alta resolución de medio millón de kilómetros cuadrados y que esto permitirá hacer muchas más anotaciones además de simplemente mostrar dónde están las construcciones.
De hecho, los datos de DigitalGlobe son mucho más detallados que los que presenta la NASA, los cuales tienen una resolución de decenas de metros por pixel cuadrado. Amazon ayudará a los datos de SpaceNet a través de sus servicios de cómputo en la nube.
NVIDIA, en cambio, dará las herramientas para ayudar a los investigadores del aprendizaje por computadoras para entrenar y probar los algoritmos sobre los datos. Finalmente, CosmiQ Works, una división de la CIA, también está dando apoyos al proyecto.
El software será entrenado para etiquetar construcciones en las imágenes de satélite usando esta colección de imágenes.
“Necesitamos desarrollar nuevos algoritmos para estos datos”, dice Tony Frazier, vicepresidente senior de DigitalGlobe. La compañía opera cuatro satélites de imágenes y da información a las agencias de inteligencia norteamericanas, agencias humanitarias y otras organizaciones que siguen basando sus datos en la capacidad humana para extraer información.
Frazier dice que debería ser posible entrenar el software para hacer cosas como mapas y construcciones, ver los cambios en la infraestructura urbana (por ejemplo en señalizaciones y parques) y medir los materiales usados en techos y otras estructuras. Este tipo de información puede ser muy valiosa y ayudar a informar a los programas de ayuda e incluso de salud.
Mark Johnson, CEO de Descartes Labs, dice que los nuevos datos podrían ser bienvenidos para los investigadores. Las aplicaciones potenciales, podrían incluir la salida económica estimada de la actividad en áreas urbanas, o en las decisiones de los gobiernos de las ciudades, o tal vez en cómo mejorar ciertos servicios, como el de recolección de la basura.
SpaceNet está modelado sobre ImageNet, una colección de un millón de fotografías etiquetadas con las que han trabajado investigadores ya por años en lo que se refiere a visión por computadora. Empresas como Google han modelado sus trabajos basándose en lo que ImageNet ha producido.
Referencias: