Google Translate tiene actualmente 200 millones de usuarios activos que usan el sistema para traducir entre 64 idiomas diferentes. Cuando inició el servicio, a principios de 2001, las facilidades que daba no eran tan buenas y sólo podía traducir 8 idiomas, hacia o desde el inglés.
Franz Och, quien encabeza el grupo de traducción de Google, escribió en el blog de la empresa que desde que fue reclutado, en 2004, viniendo de DARPA, donde había estado trabajando en un nuevo enfoque sobre el tema, vía el manejo de los datos, para así tener una traducción adecuada hecha por la computadora, inicialmente estaba escéptico sobre cómo se iba a escalar esto a niveles solamente vistos en los proyectos de Google.
Inicialmente, el sistema tardó 40 horas y mil máquinas para traducir mil oraciones, pero para finales de abril de 2006, una versión en línea del sistema árabe–inglés fue lanzada al público y desde entonces se ha expandido. Och resume así la situación actual: “Cada día traducimos aproximadamente tanto texto como el que puede encontrarse en un millón de libros. Para ponerlo de otra manera, lo que todos los traductores profesionales humanos producen en un año, nuestro sistema lo hace en un solo día. Considerando este estimado, la mayoría de lo que se traduce en el planeta se hace ahora vía Google Translate.
Las facilidades de Google Translate se usan en muchos sitios porque pueden ser usados como widgets e incorporarse a páginas web muy fácilmente. Esto permite que los usuarios puedan ver páginas web en unos cincuenta idiomas diferentes. Pero aún más, gracias al API de Translate, el cual ahora es un servicio de pago, es uno de los sistemas más populares de Google para producir servicios y productos que pueden llegar a una audiencia global sin que los usuarios tengan un idioma en común.
Hace apenas un par de años cualquier experto en inteligencia artificial hubiese predicho que la ruta de la traducción mecánica estaba casi con certeza en el estudio de la gramática y la sintaxis, así como en sistemas matemáticos complejos que modelaran las regularidades de los idiomas. Sin embargo, se sorprenderían de saber que los mejores sistemas de traducción usados hoy en día son esencialmente estadísticos y trabajan muy bien gracias a que tienen alimentada mucha información. Tal vez Google Translate es el mejor ejemplo del uso masivo de datos.
Fuente: i-programmer