Ayuda
Ir al contenido

Dialnet


Resumen de AI is great, isn’t it?: Tone direction and illocutionary force delivery of tag questions in Amazon’s AI NTTS Polly

Alfonso Rodríguez Fernández-Peña

  • español

    Este trabajoofrece un análisis descriptivo de la dirección tonal y la fuerza ilocucionaria en las pregun-tas ratificadas (o tag questions,en inglés)generadas por el sistema de texto a voz Polly de Amazon. Se examinan tres tipos de preguntas (polaridad revertida—positivas y negativas —, polaridad idéntica y orden) utilizando 10 frases como muestra para cada una. Se emplearon las voces sintéticas disponi-bles en inglés británico y americano y segeneraronun total de 600 muestras de audio. Estas se anali-zaron conPraatpara identificar el patrón tonal y confirmar la fuerza ilocucionaria presente en ellas. Los resultados revelan que la tecnología de síntesis de habla de Amazon aún no es completamente fiable, ya que produce un alto número de frases con una carga pragmática inadecuada para lograr una entonación natural en las preguntas ratificadas en inglés.

  • català

    Aquest treball proporciona una anàlisi descriptiva de la direcció tonal i la força il·locutiva inherent en les preguntes amb cua(o tag qüestions, en anglès)generades pel sistema de text a veu Polly d’Amazon. S’han examinat tres tipus de preguntes (de polaritat invertida—tant positives com negatives—,de còpia i d’ordre),utilitzant 10 frases com a mostra decada cas. Es van utilitzar les veus sintètiques disponibles per a l’anglès britànic i l’americà, i es van generar un total de 600 enunciats. Aquests fitxers d’àudio es van analitzar amb Praatper identificar-neel patró tonal i confirmar la força il·locu-tiva que s’esperava. Els resultats indiquen que la tecnologia de síntesi de parla d’Amazon encara no és del tot fiable,ja que en el moment de produir trets de la parla espontània natural com les marques de pregunta es produeixen força enunciats amb una càrrega pragmàtica no desitjada.

  • English

    This work provides a descriptive analysis of the tone direction and its inherent illocutionary force in question tags delivered by Amazon’s neural text-to-speech system Polly. We included three types of tag questions (reverse-polarity tags — both positive and negative —, copy tags and command tags) for which 10 sentences were used as input in each case. The data included 600 utterances produced by British and American English voices currently available on Amazon’s NTTS. The audio files were examined with the speech analysis software Praat to identify the tone pattern for each utterance and confirm the intended illocutionary force. The results show that Amazon’s AI speech synthesis technology is not yet fully reliable and produces a high rate of utterances whose pragmatic load is undesired when using natural spontaneous speech traits as question tags.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus