Si Kinect está revolucionando la manera de jugar los juegos de video. Si es que aún alguien duda de esto, entonces se sorprenderán cuando sepan de KinectFusion: un sistema que puede mapear el entorno para crear modelos 3D que pueden ser usados en ambientes virtuales. Es una manera quizás de mezclar lo real con lo virtual.
Ahora se cumplen 20 años de Microsoft Research, y el video sobre KinectFusion es uno de estos desarrollos que parecen haberse hecho justo a tiempo ahora que la empresa de las ventanas, en su esquema de investigación y desarrollo, cumple un aniversario más.
En el video demostrativo (ver más abajo), puede verse como, a través de software y una cámara Kinect, se pueden crear modelos 3D, que aunque se ven con relativa baja resolución, demuestran las posibilidades potenciales de este desarrollo. Evidentemente algunas de las habilidades de Kinect se basan en su convergencia al poder de procesamiento gráfico, que está creciendo considerablemente, además de una serie de algoritmos ingeniosos, implantados por Microsoft Research y presentados en SIGGRAPH este año en Vancouver, Canadá. Se esperan más detalles porque Microsoft aún no ha publicado en ninguna revista especializada el cómo ha logrado este avance en las gráficas tridimensionales.
Lo importante es la rapidez para crear modelos 3D a partir de lo que ve la cámara de Kinect. Se puede literalmente escanear todo el cuarto en un par de segundos y recrear el modelo de forma tridimensional. El render de las imágenes tridimensionales es prácticamente en tiempo real. Es francamente notable.
El sistema reconoce si se quitan objetos del entorno para mantener la representación final idéntica a lo que la cámara Kinect ve. De hecho, será interesante leer cómo funciona esta idea porque no es nada fácil unificar el escaneo de las imágenes, a partir del punto de vista que está viendo la cámara, para crear imágenes 3D que además, esconden y llenan lo que se esconde desde ciertos puntos de vista.
Los modelos que genera además, son volumétricos y no solamente en modo wireframe (que se usa con frecuencia cuando quiere verse el resultado rápidamente). Esto significa que KinectFusion contiene algoritmos que predicen la geometría, aunque es difícil determinar exactamente qué significa esto sin un documento que explique lo que la gente de Microsoft está haciendo.
Pero independientemente de cómo es que el sistema funcione, lo hace lo suficientemente bien para permitir la interacción entre éste y un sistema de partículas en conjunto con un render texturizado. La clave de todo esto es la capacidad computacional de los GPUs, que son la nueva tendencia en procesamiento en paralelo, usando tarjetas de video que contienen procesadores de imágenes muy poderosos.
Fuente: i-programmer
Otras fuentes interesantes:
Todo acerca de Kinect
Entrada de datos vía gestos 3D