Segmentación automática de voz basada en modelos ocultos de Markov y características acústicas

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1895
Información del item - Informació de l'item - Item information
Título: Segmentación automática de voz basada en modelos ocultos de Markov y características acústicas
Autor/es: Docío Fernández, Laura | García Mateo, Carmen
Palabras clave: Segmentación automática de voz | Modelos ocultos de Markov | Unidades acústicas
Fecha de publicación: sep-2000
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: DOCÍO FERNÁNDEZ, Laura; GARCÍA MATEO, Carmen. “Segmentación automática de voz basada en modelos ocultos de Markov y características acústicas”. Procesamiento del lenguaje natural. Nº 26 (sept. 2000), pp. 191-196
Resumen: Un aspecto muy importante en el ámbito de las tecnologías del habla, lo constituyen las bases de datos segmentadas y etiquetadas de forma precisa ya sea a nivel fonético, de sub-palabra o de palabra. Sin embargo, un etiquetado y segmentación manual es una tarea que consume mucho tiempo y muy propensa a errores. Este artículo describe un procedimiento automático para realizar la segmentación de voz en un conjunto de unidades acústicas: dado el contenido fonético o lingüístico de una locución, el sistema proporciona las fronteras temporales de las unidades. La técnica se basa en el uso de un reconocedor que utiliza modelos ocultos de Markov (HMMs) para modelar cada una de las unidades acústicas. Dicho reconocedor proporciona una segmentación burda inicial obtenida a través de un alineamiento de Viterbi, la cual será refinada posteriormente por medio de una "segmentación acústica" y un pequeño conjunto de reglas basadas en características acústicas. Estas reglas representan conocimiento fonético y su finalidad consiste en la corrección de errores de segmentación inesperados, los cuales son un principal problema de los reconocedores basados en HMMs.
Patrocinador/es: Este trabajo ha sido parcialmente financiado por la CICYT con el proyecto FEDER 1FD97-0077 "Sistemas de diálogo para el acceso telefónico a servicios telemáticos".
URI: http://hdl.handle.net/10045/1895
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 26 (septiembre 2000)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_26_29.pdf234,52 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.