Ayuda
Ir al contenido

Dialnet


Verificación de locutores mediante redes neuronales discriminantes

  • Autores: Carlos E. Vivaracho
  • Directores de la Tesis: Javier Ortega García (dir. tes.), Luis Alonso Romero (codir. tes.)
  • Lectura: En la Universidad de Valladolid ( España ) en 2004
  • Idioma: español
  • Tribunal Calificador de la Tesis: Luis Alfonso Hernández Gómez (presid.), Quiliano Isaac Moro Sancho (secret.), Joaquín González Rodríguez (voc.), Carmen García Mateo (voc.), Ángel Luis Sánchez Lázaro (voc.)
  • Texto completo no disponible (Saber más ...)
  • Resumen
    • La presente tesis aborda el problema de la autenticación de la identidad de un individuo por medio de su voz, tarea denominada verificación Automática de Locutores (VAL). Dentro de las distintas partes que componen un sistema de VAL: adquisición, extracción de características y clasificación, el estudio se ha centrado en la última, proponiendo el uso de Redes Neuronales Artificiales (RNA), como clasificador discriminante. Se entrena una RNA por individuo a verificar (cliente), de manera que aprenda a diferenciar entre muestras pertenecientes al cliente, y muestras pertenecientes al resto de la individuos, genéricamente denominados impostores; para lograrlo la red entrenada con ejemplos de ambas clases.

      Los trabajos realizados se pueden dividir en 3 grandes bloques:

      1. Estudio comparativo del rendimiento de las RNAs frente al de los Modelos de Mezcla de Gaussianas (MMG), los más utilizados en verificación de locutores.

      Los resultados al usar como RNA un Perceptrón Multicapa (Multilayer Perceptron, MLP), muestran un comportamiento similar al de los MMG para vez telefónica (la de mayor interés desde el punto de vista práctico), siendo, a veces, incluso algo superior. En esta parte del trabajo también se ha estudiado la influencia de distintos parámetros del sistema basado en MLP, como son: el tamaño de la red, la normalización del vector de entrada y el método para igualar el tamaño de la red, la normalización del vector de entrada y el método para igualar el tamaño de los conjuntos de entrenamiento.

      2. Análisis del rendimiento del sistema resultante de la parte anterior (sistema base) siguiendo una evaluación estándar: la propuesta por NIST (National Instutute of Standards and Technology, USA), la más importante a nivel mundial en VAL, y usando el subcorpus de la base de datos en castellano AHUMADA propuesto en las evaluaciones de los años 2000 y 2001.

      3. Modificación del sistema base, proponiendo y proba


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno