Comparación de modelos de lenguaje en tareas de transcripción automática de noticiarios televisivos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1324
Información del item - Informació de l'item - Item information
Título: Comparación de modelos de lenguaje en tareas de transcripción automática de noticiarios televisivos
Autor/es: Diéguez Tirado, Javier | García Mateo, Carmen | Cardenal López, Antonio
Palabras clave: Adaptación del modelo de lenguaje | Transcripción de voz | Programas de noticias | Language model adaptation | Speech transcription | Broadcast news
Fecha de publicación: sep-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: DIÉGUEZ TIRADO, Javier; GARCÍA MATEO, Carmen; CARDENAL LÓPEZ, Antonio. “Comparación de modelos de lenguaje en tareas de transcripción automática de noticiarios televisivos”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 269-276
Resumen: En el presente artículo se investigan diversas técnicas de modelado de lenguaje para una tarea de transcripción automática de noticiarios bilingües. Se compara una aproximación no adaptada con varios esquemas basados en interpolación de modelos. Mediante una estrategia de adaptación dinámica, utilizando reconocedores en paralelo, se ha conseguido reducir la tasa de errores de reconocimiento en un 20.7% con respecto al modelo no adaptado. El artículo también analiza los problemas del habla espontánea que han limitado las mejoras. | In this paper several language models for a bilingual broadcast news transcription task are investigated. A non-adapted approach is compared to various schemes based on mixture models. Through the use of a dynamic adaptation strategy, employing several decoders in parallel, a 20.7% reduction in the word error rate was achieved with respect to the non-adapted model. This paper also analyzes the problems of spontaneous speech, which have limited the improvements.
Patrocinador/es: Este proyecto ha sido parcialmente apoyado por el MCyT de España, bajo el proyecto TIC2002-02208, y la Xunta de Galicia bajo el proyecto PGIDT03PXIC32201PN.
URI: http://hdl.handle.net/10045/1324
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_35_33.pdf253,34 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.