Ayuda
Ir al contenido

Dialnet


Arquitectura para conversión texto-habla multidominio

  • Autores: Francesc Alías, Xavier Sevillano, Pere Barnola, Joan Claudi Socoró
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 31, 2003, págs. 83-90
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      este trabajo presenta una evolución en el díseño de la arquitectura para la conversión texto-habla multidominio (CTB-MD) basada en selección de unidades. Esta aproximación intenta conseguir una calidad sintética próxima a la de los sistemas de CTH de dominio limitado sin dejar de lado la síntesis de propósito general. La arquitectura multidominio implica disponer de un corpus de voz dividido en distintos dominios y estructurado jerárquicamente para optimizar el proceso de selección de unidades. En este trabajo, la jerarquización del corpus de voz se realiza mediante análisis en componentes independientes. Por otra parte, la CTH-MD necesita disponer de un módulo de clasificación de textos adaptado sana necesidades.

    • English

      This paper presents an evolution in the design of multi-domain unit selection text-to-speech (MD-TTS) architecture. The goal of this approach is to achieve good synthetic quality like the limited domain TTS systems, without discarding a general purpose synthesis. The multi-domain architecture entails a speech corpus containing several domains.Moreover, it has been hierarchically structured by means of independent component analysis in order to optimize the unit selection process. On the other hand, MD-TTS demands a module capable to classify the texts in multiple domains, considering the system requirements.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno