Ayuda
Ir al contenido

Dialnet


Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

  • Autores: Ángel de la Torre Vega
  • Directores de la Tesis: Antonio M. Peinado Herreros (dir. tes.), Antonio José Rubio Ayuso (codir. tes.)
  • Lectura: En la Universidad de Granada ( España ) en 1999
  • Idioma: español
  • Tribunal Calificador de la Tesis: Francisco Casacuberta Nolla (presid.), José Carlos Segura Luna (secret.), Enric Monte Moreno (voc.), José Luis Alba Castro (voc.), Eduardo López Gonzalo (voc.)
  • Materias:
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • La presente tesis aborda el problema de la representación en los sistemas de reconocimiento de voz. En este trabajo se presentan y discuten diversas técnicas orientadas a mejorar la representación de la voz para el reconocimiento.

      Las técnicas propuestas se pueden situar en dos grupos:

      * Las primeras tratan de mejorar la capacidad discriminativa de la representación mediante la aplicación de transformaciones. Aunque estas técnicas no están diseñadas explícitamente para mejorar el rendimiento de los reconocedores en ruido, al incrementarse la capacidad discriminativa de la representación tienden a mejorar el rendimiento tanto en condiciones limpias como ruidosas.

      * Las técnicas del segundo grupo están diseñadas para adaptar la voz ruidosa a un entorno limpio de referencia. Dentro de este grupo se han desarrollado tanto técnicas que realizan una adaptación ciega (sin hacer consideraciones relativas al ruido) como técnicas que realizan la adaptación en base a un modelo del ruido.

      La tesis se ha organizado en tres grandes bloques. El primero de ellos presenta el problema del reconocimiento automático de voz y la representación de la voz. También incluye información general acerca de los experimentos realizados en esta tesis: bases de datos, sistemas de reconocimiento, tareas, etc. El siguiente bloque está dedicado a los métodos propuestos para mejorar la representación de la voz desarrollados en base a criterios discriminativos.

      El tercer bloque aborda el problema del reconocimiento de voz en ruido.

      Se analiza el problema del reconocimiento de voz contaminada: se propone y estudia un método ciego (sin consideraciones previas relativas al ruido) para compensar el ruido; también se propone un modelo para describir el ruido y se presenta un método para estimarlo; para concluir el bloque, se proponen y estudian varios métodos para compensar el ruido, haciendo uso del modlo. Finalmente, la tesis se cierra con un ca


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno