On the definition of a prosodically balaced corpus: combining greedy algorithms with expert guided manipulation

Autores: David Escudero Mancebo, Lourdes Aguilar, Antonio Bonafonte Cávez, Juan María Garrido Almiñana
Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 43, 2009, págs. 93-101
Idioma: inglés
Títulos paralelos:
- Hacia la definición de un corpus equilibrado prosódicamente: estrategia combinada de algoritmos voraces y manipulación de expertos
Enlaces
- Texto completo

Resumen
- español
  Este artículo presenta el proceso de definición de un corpus de texto equilibrado en términos de atributos prosódicos. Se presenta formalmente la aplicación de algoritmos voraces y se discuten sus limitaciones. Además, se propone una guía de manipulación de textos que contribuye a mejorar considerablemente los resultados. El trabajo experimental constata este hecho con la aplicación de la metodología en diversos corpus de noticias radiofónicas en español.
- English
  This article reports the process of building a balanced text corpus taking into account prosodic features. We formalize the application of greedy algorithms for text selection and we discuss their limitations. We also defend an expert guideline for text manipulation that significantly improves the performance of the algorithms. The application of this methodology to a radio news corpus empirically supports the proposed strategy.

Acceso de usuarios registrados

¿Es nuevo? Regístrese

Coordinado por: