Ayuda
Ir al contenido

Dialnet


Un estudio de caso sobre los cuatro momentos espectrales y el pico de máxima intensidad de /s/ en una voz natural y una voz clonada por la IA Elevenlabs

    1. [1] Universidad Nacional Mayor de San Marcos

      Universidad Nacional Mayor de San Marcos

      Perú

  • Localización: Lengua y Sociedad, ISSN 1729-9721, ISSN-e 2413-2659, Vol. 23, Nº. 2, 2024, págs. 1069-1097
  • Idioma: español
  • Títulos paralelos:
    • Um estudo de caso sobre os quatro momentos espectrais e o pico máximo de intensidade de /s/ em uma voz natural e uma voz clonada pela AI Elevenlabs
    • A case study on the four spectral moments and the peak intensity of /s/ in a natural voice and a voice cloned by AI Elevenlabs
  • Enlaces
  • Resumen
    • español

      La presente investigación compara los cuatro momentos espectrales y el pico de mayor intensidad de la fricativa alveolar [s] en posición de coda, entre la voz natural y la artificial de un locutor. Los datos de la voz natural fueron recolectados en un entorno controlado y segmentados posteriormente con el software Praat. Para la voz artificial, se utilizó la tecnología de clonación de voz de ElevenLabs. El análisis de varianza muestra diferencias significativas entre las medias de los parámetros acústicos analizados —centro de gravedad, desviación estándar, curtosis, asimetría y el pico de máxima intensidad— en la voz natural y artificial. Sin embargo, al analizar los datos agrupados por la vocal que precede a la fricativa, se observa que no en todos los contextos existen diferencias significativas. Los resultados indican que los parámetros espectrales de la fricativa alveolar /s/ —especialmente el centro de gravedad— son útiles para distinguir entre la voz natural y su contraparte artificial.

    • português

      A presente investigação compara os quatro momentos espectrais e o pico de maior intensidade da fricativa alveolar [s] em posição de coda, entre a voz natural e artificial de um falante. Os dados de voz natural foram coletados em ambiente controlado e posteriormente segmentados com software Praat. Para a voz artificial foi utilizada a tecnologia de clonagem de voz da ElevenLabs. A análise de variância mostra diferenças significativas entre as médias dos parâmetros acústicos analisados ​​– centro de gravidade, desvio padrão, curtose, assimetria e pico de intensidade máxima – na voz natural e artificial. Porém, ao analisar os dados agrupados pela vogal que antecede a fricativa, observa-se que nem em todos os contextos existem diferenças significativas. Os resultados indicam que os parâmetros espectrais da fricativa alveolar /s/ – especialmente o centro de gravidade – são úteis na distinção entre a fala natural e a sua contraparte artificial.

    • English

      This research compares the four spectral moments and the peak of greatest intensity of the alveolar fricative [s] in coda position between the natural and artificial voice of a speaker. The data from the natural voice were collected in a controlled environment and subsequently segmented with Praat software. For the artificial voice, ElevenLabs' voice cloning technology was used. The analysis of variance shows significant differences between the means of the acoustic parameters analyzed—center of gravity, standard deviation, kurtosis, skewness, and the peak of maximum intensity—in the natural and artificial voices. However, when analyzing the data grouped by the vowel preceding the fricative, it is observed that not all contexts show significant differences. The results indicate that the spectral parameters of the alveolar fricative /s/—especially the center of gravity—are useful to distinguish between the natural voice and its artificial counterpart.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno