Implementation of a Voice Recognition System in the Nasa Yuwe Language Based on Convolutional Neural Networks

Julio Enrique Muñoz Burbano; Pablo Emilio Jojoa; Fausto Miguel Castro Caicedo

Ayuda

Implementation of a Voice Recognition System in the Nasa Yuwe Language Based on Convolutional Neural Networks

Muñoz Burbano, Julio Enrique ^[1] ; Jojoa Gomez, Pablo Emilio ^[1] ; Castro Caicedo, Fausto Miguel ^[2]
1. [1] Universidad del Cauca
  
  Universidad del Cauca
  
  Colombia
2. [2] Universidad Nacional Abierta y a Distancia
  
  Universidad Nacional Abierta y a Distancia
  
  Colombia
Localización: Ingeniería Solidaria, ISSN-e 2357-6014, Vol. 19, Nº. 1, 2023
Idioma: inglés
Títulos paralelos:
- Implementación de un sistema de reconocimiento de voz en el lenguaje Nasa Yuwe basado en Redes Neuronales Convolusionales
Enlaces
- Texto completo

Dialnet Métricas: 1 Cita

Resumen
- español
  Introducción: Este artículo presenta la Implementación de un algoritmo para el reconocimiento de voz en el lenguaje Nasa Yuwe basado en Redes Neuronales Convolusionales (RNC), desarrollado en la Universidad del Cauca en el año 2022.
  
  Problema: La riqueza fonética del lenguaje Nasa Yuwe es grande, al poseer 32 vocales, y 34 consonantes, lo que lleva a confusiones en la pronunciación y por lo tanto a dificultades en el reconocimiento de patrones de voz.
  
  Objetivo: Implementar un algoritmo de reconocimiento de voz, para el lenguaje Nasa Yuwe soportado en RNC.
  
  Metodología: Se realizó el preprocesamiento de las señales de audio para posteriormente obtener las características por medio de los escalogramas de los coeficientes de Mel. Finalmente se propone una arquitectura de la RNC para el proceso de clasificación.
  
  Resultados: Se construye un DataSet a partir de los escalograma de los patrones de voz, y se realiza el proceso de entrenamiento de la RNC.
  
  Conclusión: La implementación de un SRV basado RNC, proporciona bajos márgenes de error en el proceso de clasificación de palabras del lenguaje Nasa Yuwe.
  
  Originalidad: El sistema de reconocimiento de voz planteado es el primero y único en su clase que se ha realizado hasta el momento, con el propósito de colaborar en el proceso de enseñanza, conservación y aprendizaje del lenguaje Nasa Yuwe.
  
  Limitaciones: Se requiere aumentar el número de patrones de voz aportados por hablantes nativos, y se plantea la necesidad de implementar otras herramientas tecnologías que permitan la conservación y difusión del lenguaje Nasa Yuwe.
- English
  Introduction: This paper presents the Implementation of an algorithm for voice recognition in the Nasa Yuwe language based on Convolutional Neural Networks (CNN), developed at the Universidad del Cauca in the year 2022.
  
  Problem: The Nasa Yuwe language is phonetically rich, as it has 32 vowels and 34 consonants, which leads to confusion in pronunciation and therefore difficulties in recognizing voice patterns.
  
  Objective: To implement a speech recognition algorithm for the Nasa Yuwe language supported in CNN.
  
  Methodology: The preprocessing of the audio signals was carried out to subsequently obtain the characteristics through the scalograms of the Mel coefficients. Finally, an architecture of the CNN is proposed for the classification process.
  
  Results: A DataSet is built from the scalograms of the voice patterns, and the CNN training process is carried out.
  
  Conclusion: The implementation of a Voice Recognition System based on CNN provides low margins of error in the word classification process of the Nasa Yuwe language.
  
  Originality: The proposed voice recognition system is the first and only one of its kind that has been carried out so far, with the purpose of collaborating in the process of teaching, preserving and learning the Nasa Yuwe language.
  
  Limitations: It is necessary to increase the number of voice patterns provided by native speakers, and there is a need to implement other technological tools that allow for the conservation and dissemination of the Nasa Yuwe language.