Ayuda
Ir al contenido

Dialnet


Resumen de Realización de un reconocedor de voz en tiempo real para habla continua y grandes vocabularios

Antonio Cardenal López

  • En esta tesis se ha diseñado y construido un reconocedor de voz para habla continua y grandes vocabularios, orientado a aplicaciones que requieran un funcionamiento en tiempo real, El sistema es de tipo multipase con una primera busqueda basada en un algoritmo Viterbi sincrono,y un segundo pase basado en tecnicas de tipo word-graph. Se utiliza un solo arbol de vocabulario con modelos inter-palabra incluidos, y un modelo de lenguaje separado.

    Para permitir la utilizacion de vocabularios extensos el lexicon de reconocimiento se ha organizado en forma de arbol, comprobandose diversos tipos de comprension.

    Tambien se han incluido metodo de prediccion del modelo del lenguaje que resultan necesarios si se utiliza una organización en arbol.

    El sistema construido ha sido probado sobre varios experimentos diferentes.

    En la fase de desarrollo se utilizaron dos bases de datos en gallego, con multiples locutores y calidad telefonica, que contienen realizaciones de frases cortas y largas. Finalmente se diseño una base de datos de habla continua para efectuar un conjunto de experimentos preliminares sobre un escenario de test mas cercano a las aplicaciones a que va dirigido el reconocedor.

    Esta base, tambien multilocutor y con calidad telefonica, contiene parrafos largos de texto periodistico. Aunque los resultados obtenidos en este ultimo experimento muestran que el sistema ofrece buenas prestaciones en tareas complejas, el sistema debera ser probado en el futuro sobre escenarios reales.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus