Yo no sé las razones por las cuales el procesamiento de la voz humana no ha tenido el éxito suficiente para que se imponga como la interfaz más natural para comunicarnos con la computadora.
El estudio de la voz, de los fonemas, de los lenguajes humanos, ha sido francamente exhaustivo y hoy existen una serie de programas que permiten entender lo que decimos, por ejemplo, Cortana y Siri, de forma que pueden contestar a nuestras preguntas como sin fuesen oráculos modernos.
Antes de estas aplicaciones, existían algunas (que todavía están en el mercado), como “Dragon Naturally Speaking”, que se instalaba en la computadora y permitía dictarle a la máquina, por ejemplo, usando Word, de forma que lo que le decíamos vía el micrófono aparecía como texto escrito.
Hay que decir que este programa, al menos hace unos años, había que entrenarlo para que entendiera el tono de voz del usuario que lo usaría y eso se hacía a través de la lectura de un cuento corto como Pinocho. Tal vez con los avances actuales esto ya no sea necesario.
Y la verdad es que probablemente podría ser mucho más efectivo dictar un texto que escribirlo y, de hecho, aunque los sistemas actuales aún cometen pequeños errores en las palabras procesadas, parece ser menos complicado el corregir los textos dictados que el escribirlos directamente en la máquina y editarlos convenientemente.
Lo mejor es que hoy en día hay una serie de sitios web que permiten este tipo de tareas de forma muy simple. Si le pone a su buscador “dictation online”, aparecerán muchos sitios. Los mejores aparecen al principio y me concentraré en ellos.
El primero, “https://dictation.io/“, permite dictarle en un buen número de idiomas, a través del micrófono, que debe estar conectado a su computadora, el texto que se deseé. En el idioma español incluso el sistema permite definir si es “español mexicano” o “español boliviano”.
De esta manera, la interpretación y posterior transcripción del texto resulta bastante adecuada aunque repito, no es un dictado perfecto y el sistema de pronto asume algunas palabras que uno no dijo pero las pone. El sistema tiene un menú para incorporar al texto generado, los símbolos como punto, punto y coma, dos puntos, etcétera. Pero eso se hace invocando el menú en la página web y eligiendo la opción deseada.
Otro sitio sorprendentemente bueno es “https://speechnotes.co/“, el cual hace una tarea similar, pero le agrega de forma más simple que en el sitio anteriormente mencionado. Por ejemplo, podemos dictar “nueva línea” al programa y entonces nos dará una nueva línea en el block de notas que aparece en la página, que es donde queda el texto. Y no faltará quien me pregunte ¿cómo le dicto las palabras “nueva línea”? Fácil, dicte primero “nueva”, haga una pausa y dicte “línea”.
Obviamente estos sistemas aún no son perfectos, pero en algunos casos pueden ser muy útiles para poder transcribir grabaciones o lo que simplemente uno puede decir en la pantalla. De hecho, en speechnotes.co hay un servicio para transcribir archivos mp3. El sistema cuesta unos 20 dólares por año (que es muy barato), pero además, se puede hacer una prueba gratuita por siete días, para así ver qué tan bien este sistema de reconocimiento de voz hace la tarea.
Hay que decir que aunque estos sistemas son impresionantemente buenos, hay que dictarles con claridad. Si usted necesita de hacer muchos dictados, debería considerar estas opciones. Quizás le saldría incluso más barato que contratar a alguien para que haga esta tarea. Ahí están las opciones, échele un ojo y decida por usted mismo.
Referencias: Google (dictation online)