Ayuda
Ir al contenido

Dialnet


Segmentación automática de noticias mediante procesamiento de formas prosódicas

  • Autores: Lluís Mas Manchón
  • Localización: Ingeniare: Revista Chilena de Ingeniería, ISSN-e 0718-3305, ISSN 0718-3291, Vol. 22, Nº. 3, 2014, págs. 374-383
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      La segmentación automatizada de noticias en tiempo real es un problema que ha tenido un abordaje fundamentalmente lingüístico y de procesamiento de la señal en los últimos años. El trabajo que presentamos tiene un enfoque sustancialmente diferente: desde una perspectiva comunicológica, se toman las formas prosódicas típicas del discurso informativo y se intentan programar mediante el procesamiento cepstrum en el entorno Labview. Después de numerosas pruebas se fijan los diferentes parámetros de procesamiento y estilización de la curva macromelódica basada en los máximos de pitch (parábolas). Se formula un algoritmo de segmentación automática de noticias a partir de la detección de pausas y el análisis de formas prosódicas de inicio y final de noticia. Sobre una muestra de cinco informativos reales emitidos en el canal español Cuatro en julio de 2009, el entorno detecta 98 pausas y etiqueta correctamente (corte/no corte) el 76% de las mismas. La totalidad de los cortes estaban contenidos en las 98 pausas localizadas, de los cuales el algoritmo pasa por alto 9 y genera 15 errores de cortes mal emplazados. Tanto la lingüística computacional como el procesamiento del habla pueden tener un importante margen de mejora si también se asume la perspectiva comunicológica: agrupar datos acústicos como variables complejas asociadas a cada acto de comunicación. Para futuros trabajos, este algoritmo puede ser mejorado si se complementa con sistemas de identificación de locutores, discriminación de ruidos y word spotting.

    • English

      The automatic segmentation of real-time news has been mainly researched by linguistics and signal processing disciplines in the last years. The piece of work presented here has a substantially different approach: from a communication perspective, the specific prosodic forms of news discourse are taken into consideration and programmed in Labview program by using the cepstrum processing. After several tests, the processing parameters are set to generate a macromelodic curve fitting based on pitch maximums (parabola). An algorithm of automatic news segmentation is designed by means of spotting pauses and analyzing prosodic forms for the beginning and the end of the piece of news. With a sample of five news programs broadcasted in the Spanish channel Cuatro in July 2009, the programming environment spots 98 pauses and labels correctly (cut/not cut) 76% of them. The totality of real cuts is contained in those 98, of which the algorithm misses 9 and finds 15 non-cuts. Both the computational linguistics and the spoken language processing have room for improvement by assuming a communication perspective too: group acoustic data as complex variables associated to the act of communication. For future pieces of research, this algorithm may be improved by complementing it with speakers' recognition systems, noise detection and word spotting.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno