Investigadores de la Universidad de Carnegie Mellon, del Instituto de Robótica han creado recientemente un modelo intuitivo físico que permite predecir los efectos de una colisión. El modelo de aprendizaje de máquinas, presentando en ArXiv, se halló que generaliza el problema incluso en situaciones en donde escenas similares son simuladas con propiedades diferentes.
“Cuando ocurre una colisión, los seres humanos podemos inferir la física detrás de esto y usar esta información para predecir el efecto de la colisión”. Xialong Wang, uno de los investigadores quien llevó a cabo el estudio, indicó: “Por ejemplo, podemos predecir que una esfera rebotará cuando choca contra una caja más pesada, mientras que la esfera se mantendrá moviéndose si choca contra un objeto menos pesado. Inspirado en esto, diseñamos un modelo físico intuitivo que puede entender las propiedades físicas (fricción, masa y velocidad), de los objetos observando videos de colisiones de objetos, lo cual ayuda a una mejor predicción del resultado de una colisión”.
En este modelo desarrollado por Wang y colegas, se usa una red neuronal convolucional (CNN), que corresponde a las dfferentes propiedades físicas. Estas frecuentemente dependen de otras que están conectadas entre sí. Los investigadores introdujeron un currículum de entrenamiento y generalizaron la función de pérdida, la cual se halló, tiene resultados muchos mejores de los esperados.
“Nuestro modelo usa una estructura de codificar/decodificador en una red neuronal“, explica Wang. “Las entradas de este modelos son los cuadros de video antes de que ocurra la colisión y en el momento de la misma. El modelo generará una representación de la masa, fricción y velocidad de los objetos de forma independiente. Las representaciones físicas entonces se decodifican para predecir el cuadro futuro después de la colisión”.
En las evaluaciones hechas por los investigadores, se encontró que el modelo generaliza muy bien en escenas con propiedades físicas en donde los objetos tienen diferentes formas. Además, el modelo fue capaz de predecir el futuro de las instancias cuando cambió el entorno físico. “Un modelo como este nos ha permitido entender mejor las redes neuronales”, comenta Wang. “En lugar de ver a la red neuronal como una caja negra, podemos ahora manipular y controlar la representación de la red para generar las predicciones que queremos”.
“Nuestro trabajo se basa en simulaciones, por lo que ahora estamos tratando de adaptar nuestro método al mundo real”, dice Wang. “El acercarnos al mundo físico real nos permitirá interactuar con robots y humanos de forma activa para entender la física involucrada”.