Un concurso de programación, con un  premio de 6,000 dólares, para resolver un problema de una gran cantidad de datos en biología computacional, produjo una solución que fue 970 veces más rápida que las soluciones existentes. Esta historia espectacular dice como una comunidad de programadores, TopCoder, con unos 450,000 miembros, entre los que hay desarrolladores, artistas creativos, algoritmistas (si se vale la expresión), etcétera, de 200 países, llegan muchas veces con enfoques innovadores a problemas del mundo real, como por ejemplo en este caso de analizar los datos de la secuencia de genes y la mutación de estos que construyen anticuerpos y receptores de células T.

El reto fue un concurso de dos semanas, que buscaba desarrollar un algoritmo predictivo que pudiese ser mejor que el enfoque estándar de NIH (MegaBLAST) y que el algoritmo alternativo creado por Ramy Arnaout del Beth Israel Deaconess Medical Centre.

Al poner el reto, los investigadores, lidereados por Eva Guinan, profesora asociada en encología de radiación del Instituto de Cáncer Dana-Farber, reformuló el problema para hacerlo accesible a los individuos no entrenados en biología computacional, en términos de encontrar la distancia editable entre una consulta a una cadena DNA y la cadena original DNA existente.

El concurso atrajo 654 programas con 89 enfoques diferentes para resolver el problema; 16 soluciones fueron mejoras al algoritmo MegaBLAST con una 970 veces más rápido en procesamiento que el algoritmo original. De acuerdo con el reporte de prensa de TopCoder: hubo 733 participantes, con 122 (17%) que enviaron código (software). Los participantes fueron de 69 países y más o menos la mitad eran profesionales mientras que el resto fueron estudiantes en varios niveles académicos. No hubo un solo biólogo computacional y solamente 5 se describieron a sí mismos conmo en investigación y desarrollo o en temas asociados a las ciencias de la vida. Cada participación colectiva involucró a 5.4 personas por entrada al concurso.  Los participantes reportaron un promedio de 22 horas para desarrollar la solución, para un total de 2684 horas de tiempo de desarrollo.

Así pues, esta idea de que los concursos de software pueden ser útiles y demostrarlo se ve claramente en este particular concurso.

Referencias:

TopCoder