Investigadores de la Universidad de Northwestern, Microsoft Research India y el Instituto Indio de Tecnología Kharagpur, han desarrollado un modelo para predecir si un libro pudiese convertirse en un bestseller en Amazon dentro de los siguientes 15 días después de su publicación. Su modelo, el cual se bosqueja en arXiv, trabaja analizando el comportamiento de la plataforma Goodreads.
Hemos estado trabajando en el análisis de la dinámicas de poblaciones de varias entidades sociales como hashtag en Twitter, tópicos en Quora, etcétera, dice Animesh Mukherjee, uno de los investigadores de este trabajo. “Sentimos que podíamos enfocarnos de manera similar para analizar la popularidad de los libros y encontramos que Goodreads era ideal para nuestras investigaciones”.
La popularidad de un libro depende de una multitud de factores y puede medirse usando muchos parámetros. En el estudio en cuestión, los investigadores se enfocaron en cómo las características de un libro que se está leyendo tienen influencia en su popularidad. Hicieron un análisis cruzado de plataformas y trataron de ligar esto con el volumen de ventas en Amazon.
“Seguimos nuestra intuición sobre que la popularidad de los libros se maneja principalmente por los lectores, de ahí la motivación para extraer el comportamiento que da origen a esta popularidad para así entender lo que pudiese pasar en el futuro con los libros. “Una de las mejores formas de cuantificar la popularidad de los libros es su número de ventas. Entonces tratamos de cuantificar la noción de popularidad en términos de los “bestsellers” de Amazon.
Los investigadores empezaron analizando el comportamiento colectivo de lectura de los usuarios de Goodreads. Entonces cuantificaron las diferentes características de las entidades de Goodreads, las cuales podían ser usadas para identificar diferencias entre los bestsellers de Amazon y otros libros menos vendidos. Finalmente desarrollaron un modelo de aprendizaje de máquinas que usa estas características para predecir cuando un libro será un bestseller en un tiempo no mayor de 15 días después de su publicación.
“Usamos los modelos más novedosos de aprendizaje de máquinas para desarrollar nuestras predicciones”, dice Mukherjee. “Observamos los ratings y revisiones de un libro en Goodreads y notamos que esto no es tan efectivo para predecir los bestsellers, así como los patrones de lectura de los usuarios. Por ejemplo, en Goodreads, un lector puede poner un mensaje sobre cuánto ha leído de un libro, en qué página está y hacer comentarios sobre el contenido. Encontramos que estas características son muy efectivas para saber si el libro pudiese ser un bestseller en el futuro”, dice el investigador.
El modelo logra un promedio de precisión de 88.72% en predecir los libros que se convertirían en bestseller después de dos semanas de su publicación. Su método, que se basa en los mensajes de los lectores, obtuvo una mejora de 16.4% comparado con los métodos que solamente usan los factores tradicionales de la popularidad, como el rating de un libro o las revisiones y críticas de los usuarios.
“Una de los hallazgos más importantes es que los libros bestsellers de Amazon no necesariamente tienen que ser calificados por una revisión de alta calidad de los lectores o por un gran volumen de ratings, dice Mukherjee. “En contraste, una gran mayoría de ellos tienen un estado de patrones de lectores después de haber leído el libro, que los distingue fuertemente del resto de los libros”.
Los investigadores también evalúan qué tan bueno es su método para predecir dos tipos de libros: aquellos que tienen muy buen rating que reciben un gran número de revisiones pero que no son bestsellers y las nominaciones de Goodreads para premiar a los mejores libros que tampoco son bestsellers. Estos logran un alto promedio de 87.1% para Goodreads y 86.22 para el primer caso.
“Creemos que este trabajo es una contribución importante a la literatura actual y que no solamente muestra el comportamiento colectivo de lecturas en una plataforma social a través de un estudio de medición riguroso, pero estableciendo también un enlace fuerte entre dos canales ortogonales, Goodreads y Amazon”, dice Mukherjee. El modelo desarrollado pudiese permitir el nacimiento de nuevas herramientas para las políticas de diseño de sitios involucrados con el tema de los libros. Esto es probablemente la razón por la cual Amazon compró Goodreads en el 2013.
“Hay muchas direcciones que queremos explorar en el futuro”, dice Mukherjee. “Una de ellas es investigar la popularidad de los diferentes géneros de libros. otro es el estudio de la interdinámica de género con la demografía de los lectores. Por ejemplo, ¿cómo el comportamiento de lectura de hombres difiere del de las mujeres y cómo ocurren términos del continente en donde se hace el análisis?