El objetivo del presente documento es el de dar una visión general sobre el sistema de reconocimiento automático de locutor BATVOX y describir las líneas fundamentales de su funcionamiento. Para ello haremos un recorrido por todos los puntos de interés alrededor del funcionamiento del sistema. En primer lugar repasaremos, a grandes rasgos, cuales son los fundamentos teóricos de funcionamiento de la tecnología que usa BATVOX para realizar sus cálculos y, en segundo lugar, trataremos cuales son los procesos fundamentales que sufre un archivo de audio cuando es introducido en el sistema. Esto implica que veremos el proceso de extracción de características, parametrización y entrenamiento de los archivos de audio por parte del sistema.
The aim of this work is to provide a general vision on the automatic speaker recognition system BATVOX, and to describe the blueprint of its functioning. For this purpose, we will give an overview of the main features of the system. We will recall briefly the theoretical bases of the technology used by BATVOX to perform its calculations, and we will mention the basic processes that undergoes an audio file when it is introduced in the system. This implies that we will see how the system carries out the characteristics extraction process, the parameterization and the training of the audio files.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados