On the definition of a prosodically balanced corpus: combining greedy algorithms with expert guide manipulation
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/11692
Título: | On the definition of a prosodically balanced corpus: combining greedy algorithms with expert guide manipulation |
---|---|
Título alternativo: | Hacia la definición de un corpus equilibrado prosódicamente: estrategia combinada de algoritmos voraces y manipulación de expertos |
Autor/es: | Escudero Mancebo, David | Aguilar Cuevas, Lourdes | Bonafonte Cávez, Antonio | Garrido Almiñana, Juan María |
Palabras clave: | Selección de subcorpus | Algoritmos voraces | Modelado prosódico | Subcorpus selection | Greedy algorithms | Prosodic modelling |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2009 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | ESCUDERO MANCEBO, David, et al. “On the definition of a prosodically balanced corpus: combining greedy algorithms with expert guide manipulation”. Procesamiento del lenguaje natural. N. 43 (sept. 2009). ISSN 1135-5948, pp. 93-101 |
Resumen: | Este artículo presenta el proceso de definición de un corpus de texto equilibrado en términos de atributos prosódicos. Se presenta formalmente la aplicación de algoritmos voraces y se discuten sus limitaciones. Además, se propone una guía de manipulación de textos que contribuye a mejorar considerablemente los resultados. El trabajo experimental constata este hecho con la aplicación de la metodología en diversos corpus de noticias radiofónicas en español. | This article reports the process of building a balanced text corpus taking into account prosodic features. We formalize the application of greedy algorithms for text selection and we discuss their limitations. We also defend an expert guideline for text manipulation that significantly improves the performance of the algorithms. The application of this methodology to a radio news corpus empirically supports the proposed strategy. |
Patrocinador/es: | Partially founded by the Ministerio de Ciencia e Innovación, Spanish Government Glissando project FFI2008-04982-C003-02 and AVIVAVOZ project TEC2006-13694-C03. |
URI: | http://hdl.handle.net/10045/11692 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 43 (septiembre 2009) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_43_11.pdf | 171,74 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.