[U-co] Voz a texto en Ubuntu

Jaime Herazo B. jaime.herazo en gmail.com
Vie Sep 4 15:41:51 UTC 2009


A ver. LLevo tiempo pendiente de este asunto en particular, y
sinceramente es decepcionante. El software existe, funciona y tiene un
rendimiento más que aceptable, según dicen los que lo han trabajado.

El problema es que el "language model", lo que le dice al software
cómo interpretar un determinado lenguaje a texto, es una parte
horriblemente lenta y tediosa. Como parte del proceso se necesita que
gente grabe su voz junto con una transcripción de la misma, para
entrenar al software y que aprenda que cuando uno dice "carro", él
debe escribir "carro".

Pero se nececita muchas pero muchas muestras para que funcione con un
determinado idioma. Según tengo entendido, se necesitan DOS MIL HORAS
de voz de alta calidad COMO MINIMO para que el software reconozca
debidamente un lenguaje, y aparentemente entre más mejor. Pero 2K
horas? una sola es jarto, y para una sola persona hacer eso le lleva
meses (un cálculo rápido me dice que dándole 8 horas al día se lleva
250 días).

Y suponiendo que aparezcan 3K horas de grabación de voz en español
listas para usar y hechas como se necesita (el sitio de Voxforge nos
da una idea, voz clara y con mínimo ruido), luego se necesita alguien
que haya desenmarañado el enredo que son estos software para convertir
eso en un modelo de lenguaje español. Por supuesto, esa es la parte
"fácil" ;)

Yo llevo tiempo pensando que si en Ubuntu hubiera una aplicacioncita
para mandar grabaciones de voz de al menos 10 minutos a Voxforge en el
determinado idioma del usuario, enlazada en el escritorio, pidiendo
que por favor contribuyan a esto con al menos esos 10 minutos
ocasionalmente, y siquiera unos 1000 usuarios se deciden a aportar con
cierta regularidad, la meta se vuelve razonable y estoy seguro que
antes de un año tenemos un Voice Powered Ubuntu. Pero la idea lleva
tiempo desde que se propuso y no se ha implementado:
https://wiki.ubuntu.com/SpeechRecognition

A mí personalmente me encantaría tener full dictado en el PC,
accesible desde cualquier programa, e incluso desde lenguajes de
programación ("use speechrecognition;" o "import speechrecognition" y
cualquier script se puede controlar por voz de una), pero en free
software por lo menos por ahora no se puede.

Ahora, si lo que se quiere es reconocimiento ligero, del estilo que
uno dice "Cartas" y sale el Openoffice Writer, en los repositorios
está este:
http://packages.ubuntu.com/jaunty/gnome-voice-control
Que es básicamente un appletcito para gnome que usa sphinx2, el
software más "simple" disponible en cuanto a esto en linux, con un
modelo de lenguaje (inglés) superpequeño para reconocer comandos, y si
quieren cacharrear extra y ponerse a necear directamente con engines
de reconocimiento, estan:
http://packages.ubuntu.com/jaunty/julius
http://packages.ubuntu.com/jaunty/julius-voxforge
El mismo sphinx2:
http://packages.ubuntu.com/jaunty/sphinx2-bin
http://packages.ubuntu.com/jaunty/sphinx2-hmm-6k
Y fuera de los repositorios está voximp, un script en python que logra
el mismo propósito:
http://code.google.com/p/voximp/
y como ya mencionaron, simon (pero de KDE):
http://tuxarena.blogspot.com/2009/08/how-to-install-simon-speech-recognition.html

Para tener reconocimiento en español, todos estos requieren que uno se
"engrase las manos bastantico" por decirlo así, así que si alguien
logra armarse un sistema de control del PC por voz en ubuntu en
español, por favor comparta con el resto de la lista cómo lo logró, y
si es posible distribuya los archivos necesarios para repetirlo en
otro computador.


El 4 de septiembre de 2009 07:52, Jorge Gonzalez<jag2kn en gmail.com> escribió:
> También este link
> http://en.wikipedia.org/wiki/Speech_recognition_in_Linux
>
> --
> Jorge Andrés González
> http://joorge.com
> Cel: 301 217 78 60
> --
> Al escribir recuerde observar la etiqueta (normas) de esta lista: http://ur1.ca/0uf7
> Para cambiar su inscripción, vaya a "Cambio de opciones" en http://ur1.ca/0uf9
>



-- 
      "Reality is that which, when you stop believing in it, doesn’t go away."
Philip K. Dick




Más información sobre la lista de distribución Ubuntu-co