REDES NEURONALES Y RECONOCIMIENTO DE PATRONES - gorkyvtn/RedesNeuronalesOrdenes GitHub Wiki
En el proyecto se usa técnicas de reconocimiento de voz, que es en un trasfondo redes neuronales que al ser importadas en tiempo real sobre la web nos dan la posibilidad de controlar la web por voz, las librerías en realidad tienen mucho futuro, podemos o solo controlar parámetros tan pequeños, sino incluso hacer búsquedas o dar ordenes mas complejas en una base de datos, las posibilidades son muchas esperemos poder seguir investigando y desarrollando mas. Es Básicamente el proceso de entrenamiento de la red y reconocimiento de la voz consta de tres partes bien diferenciadas: A) Grabación de los archivos sonoros y transformación de los mismos en un conjunto de datos o patrones que sean entendibles por parte de la red. Esta tarea de mapeo de datos es realizada por un bloque codificador de entrada.
B) Generación y entrenamiento de la red con los patrones obtenidos en la fase anterior (A). Este proceso constituirá la red neuronal propiamente dicha.
C) Prueba de la red neuronal obtenida luego del aprendizaje, mediante el reconocimiento de nuevas ocurrencias de los archivos de voz. En todos los casos se utiliza un bloque decodificador de salida para transformar el resultado de reconocimiento dado por la red a un elemento de salida entendible, y que será dado por el sistema.
Por lo que vamos a los hechos, nos pondremos sobre los navegadores actuales a programar el sistema. (Google Chrome, Mozila Firefox 17, Ie 9)
APLICACIÓN WEB Cono se esta usando las librerías actuales sobre HTML5 (sobre el desarrollo de google) embebidas no es necesario entrenar el sistema sino practicamente lanzarnos a la programacion. Para lo cual hemos colocado cosas muy sencillas y especificas como cambiar el fondo en un párrafo, cosa que se puede hacer haciendo clics sobre los vínculos con un código muy simple sobre css, luego con el uso de jquery y librerías de reconocimiento he podido asociar sobre la mayor cantidad de navegadores posibles el ejercicio, siendo principalmente mas estable sobre el navegador GoogleChrome.
La aplicación se abre desde el archivo Index.HTML en la carpeta principal.
una vez ahí tenemos la siguiente pantalla
tenemos el cuadro de texto donde podemos escribir el enunciado, pero si presionamos sobre el icono del micrófono estamos listos para decir el enunciado.
en este momento decimos uno de los enunciados (verde, rojo, azul, amarillo, grande, pequeño ) que son unas de las palabras simples y fáciles de identificar en el sistema.
Como resultado tenemos en este caso de haber dicho “verde”
Asi mismo podemos seguir haciendo click sobre el icono del micrófono y podemos decir otro enunciado para asi comprobar la funcionalidad.