Ayuda
Ir al contenido

Dialnet


Aportaciones sobre modelado paramétrico de procesos aplicados al reconocimiento automático del habla

  • Autores: Pedro José Quintana Morales
  • Directores de la Tesis: Juan L. Navarro Mesa (dir. tes.), Antonio Gabriel Ravelo García (codir. tes.)
  • Lectura: En la Universidad de Las Palmas de Gran Canaria ( España ) en 2016
  • Idioma: español
  • Tribunal Calificador de la Tesis: Rafael Pérez-Jiménez (presid.), Eduardo Hernández Pérez (secret.), Eduardo Lleida Solano (voc.), Francisco Javier Hernando Pericás (voc.), Léonard Janer García (voc.)
  • Materias:
  • Enlaces
    • Tesis en acceso abierto en: acceda
  • Resumen
    • El objetivo de este trabajo de investigación es el análisis de diferentes herramientas basadas en modelos lineales paramétricos para su aplicación en sistemas de reconocimiento de voz. Nuestra idea es trabajar en dos sub-bloques aparentemente dispares dentro del procesador acústico del sistema, como son los elementos de modelado acústico, de forma integral.

      dentro del modelado paramétrico, investigamos en la forma de extraer las características de la voz para obtener una mayor información y a la vez más detallada, que pudiera ofrecer un conocimiento más profundo del sistema de producción de voz. Para ello se emplean los modelos de polos comunes sobre tramas contiguas asociadas a las diferentes fases de las cuerdas vocales, abierta y cerrada, buscando la caracterización de los aspectos intrínsecos del proceso de prodección y pensando en la robustez de las estimaciones. Por otro lado se introducen aspectos psicoacústicos en la partametrización, para que le confiera un mayor potencial desde el punto de vista del reconocimiento. Y todo lo anterior se configurará de forma que pueda formularse de una manera integral.

      El otro elemento sobre el que investigamos es el del modelado acústico, en el cual estamos interesados en encontrar una caracterización estadística para unos parámetros acústicos de los que se desconocen sus propiedades estadísticas.

      Nuevamente los modelos paramétricos lineales nos brindan la posibilidad de su uso, dentro de la teoría espectral, para poder establecer un marco de predicción de la caracterización acústica por medio de la función de densidad de probabilidad. Esta tiene potentes propiedades para la aproximación de funciones , por lo que se esperan resultados competitivos.

      Finalmente y para comprobar las posibilidades que se abren con el uso de las herramientas desarrolladas, éstas se utilizan en sistemas de reconocimiento del habla para voces con patologías, en diferentes experimentos controlados.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno