Arquitectura para conversión texto-habla multidominio

Francesc Alías; Xavier Sevillano; Pere Barnola; Joan Claudi Socoró

Ayuda

Arquitectura para conversión texto-habla multidominio

Autores: Francesc Alías, Xavier Sevillano, Pere Barnola, Joan Claudi Socoró
Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 31, 2003, págs. 83-90
Idioma: español
Enlaces
- Texto completo
Resumen
- español
  este trabajo presenta una evolución en el díseño de la arquitectura para la conversión texto-habla multidominio (CTB-MD) basada en selección de unidades. Esta aproximación intenta conseguir una calidad sintética próxima a la de los sistemas de CTH de dominio limitado sin dejar de lado la síntesis de propósito general. La arquitectura multidominio implica disponer de un corpus de voz dividido en distintos dominios y estructurado jerárquicamente para optimizar el proceso de selección de unidades. En este trabajo, la jerarquización del corpus de voz se realiza mediante análisis en componentes independientes. Por otra parte, la CTH-MD necesita disponer de un módulo de clasificación de textos adaptado sana necesidades.
- English
  This paper presents an evolution in the design of multi-domain unit selection text-to-speech (MD-TTS) architecture. The goal of this approach is to achieve good synthetic quality like the limited domain TTS systems, without discarding a general purpose synthesis. The multi-domain architecture entails a speech corpus containing several domains.Moreover, it has been hierarchically structured by means of independent component analysis in order to optimize the unit selection process. On the other hand, MD-TTS demands a module capable to classify the texts in multiple domains, considering the system requirements.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: