Ayuda
Ir al contenido

Dialnet


Sistema de reconocimiento de voz mediante wavelets, predicción lineal y redes backpropagation

    1. [1] Universidad de Santiago de Chile

      Universidad de Santiago de Chile

      Santiago, Chile

  • Localización: Ingeniare: Revista Chilena de Ingeniería, ISSN-e 0718-3305, ISSN 0718-3291, Vol. 24, Nº. 1, 2016, págs. 8-17
  • Idioma: español
  • Títulos paralelos:
    • Wavelets, linear prediction and backpropagation networks for speech recognition system
  • Enlaces
  • Resumen
    • español

      En el presente trabajo se muestra un sistema que combina la utilización de Transformadas de Wavalet (WT, Wavalet Transform), Coeficientes de Predicción Lineal (LPC, Linear Predictive Coding) y Redes Neuronales Artificiales (ANN, Artificial Neural Networks), para reconocer vocales y sílabas en forma independiente del hablante. Usando esta estructura, se propone un software automatizado que, a través de una interfaz, permite a usuarios con dificultades de audición o ausencia total de ésta, la posibilidad de emplearlo en primera instancia como una herramienta inicial de apoyo para el aprendizaje de sílabas. En una primera etapa se incorpora un número reducido de sílabas, en especial las que podrían tener más dificultad para su identificación. Posteriormente se puede ir incorporando una mayor cantidad de sílabas, de tal forma que el sistema pueda ir creciendo. La adición de nuevas sílabas, permitirá luego (a través de la segmentación de palabras en sílabas), la implementación de un sistema mayor para identificar palabras y por consiguiente el aprendizaje del lenguaje hablado.

    • English

      A system that combines the use of Wavalet Transforms (WT), Linear Prediction Coefficients (LPC) and Artificial Neural Networks (ANN) are shown in this paper. Vowels and syllables recognition speaker independent can be made. Using this structure, automated software is proposed, which through an interface, allows users with hearing difficulties or total absence of this, the possibility of using it primarily as an initial tool to support learning of syllables. In the first stage, a small number of syllables is incorporated, especially those that may have more difficulty in their identification. Subsequently, it can be incorporated a larger number of syllables, then it can be growing. Adding new syllables, would allow (through segmenting words into syllables) a greater deployment system, for identifying complete words and therefore the spoken language learning.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno