Las empresas de cómputo no se detienen en sus avances. Microsoft, por ejemplo, ha apostado fuertemente a los servicios de Azure, su nube, la cual de hecho le da buenas utilidades. Ahora la empresa ha incorporado nuevas herramientas de la Inteligencia Artificial para proveer más servicios a sus clientes. Por ejemplo, lo que se llaman los servicios de aprendizaje de máquinas.
Los servicios de Aprendizaje de Máquinas (Machine Learning – ML) pueden ser usados ahora con Python o con R en conjuntos que hayan sido cargados en el Azure Blob o en el Data Lake Storage. El nuevo clúster ML está construido con el software de código abierto, R, y puede ser usado por miles de paquetes de código abierto en R, así como con rutinas de ScaleR, que es el paquete de análisis de “big data” de Microsoft.
La empresa indica: “Cualquier paquete de código abierto de R o Python puede trabajar con cualquier innovación propietaria de Microsoft”.
Los servicios de ML en HDInsight incluyen un conjunto de algoritmos altamente escalables como RevoscaleR, revoscalepy y microsoftML, que pueden trabajar con datos que sean más grandes que el tamaño de la memoria física. Estos servicios vienen con un conjunto de modeles pre-entrenados para análisis visual y análisis de sentimientos de texto, listos para valorar los datos que se le entreguen. Una vez que un modelo ML ha sido creado, se puede convertir en un API de webservices que está hospedado en una malla de servidores en la nube y puede así integrarse con aplicaciones locales.
La nueva versión de los servicios ML actualiza Apache Hadoop, Apache Spark 2.3, Apache Kafka 1.0, así como el arreglo de errores hallados en más de 20 entornos de código abierto que son parte de HDInsight. De hecho HDInsight provee clústers pre-definidos que incluyen los productos necesarios ara el ecosistema de Hadoop. El anuncio también incluye un 50% de rebaja en el precio de HDInsight, así como un preview de HDInsight con Azure Data Lake Storage Gen2, y mejoras en el llamado Enterprise Security Package. Es más, Azure Data Lake Storage Gen2 ya está disponible globalmente a los sistemas de archivos HDFS para guardar y analizar archivos que sean incluso del tamaño de petabytes, conteniendo billones de objetos.