En el tratamiento digital de la voz es necesario e importante conocer donde empieza y donde termina la señal de voz con exactitud, por ejemplo, en aplicaciones como las de reconocimiento de voz es necesario procesar previamente la señal; la cual consiste de segmentos de voz, silencio y otros considerados como ruido.
Se propone un algoritmo para la solución de este problema. Teniendo en cuenta los siguientes requerimientos: Robustez (funcione en ambientes adversos), Baja complejidad computacional (fácil implementación), rápido tiempo de respuesta y, exactitud a la hora de encontrar los puntos de inicio y de fin de la voz. El algoritmo se diseño en tres etapas: La primera etapa viene asociada con el requerimiento de robustez al ruido a través de la técnica de substracción espectral; en la segunda etapa se mejora la calidad de la señal de voz a través de filtros y otras técnicas; en la tercera y última etapa se encuentran los limites de la señal. Para lograrlo, lo primero que se hace es extraer los parámetros que sirven como discriminantes entre segmentos que tienen voz y los que no. Para esto se utilizan las características de energía y entropía de la señal. Finalmente, la señal es enviada a una máquina de decisión que se encarga de clasificar los segmentos voz, y no voz. Durante todo el proceso se hace una evaluación de los resultados y se compara el resultado obtenido con los reportados para las técnicas de la energía y de la entropía
© 2001-2024 Fundación Dialnet · Todos los derechos reservados