Brasil
El uso de técnicas de inteligencia artificial (IA) en el contexto de los audiolibros ha ampliado las posibilidades de accesibilidad, personalización e inmersión, abarcando aspectos que van desde el reconocimiento y la síntesis de voz hasta experiencias multimodales interactivas y recomendaciones personalizadas, además de mejorar la recuperación de contenidos y ampliar el acceso a la información.El objetivo de este estudio era identificar investigaciones sobre el uso de la IA en audiolibros en la literatura académica. Para ello, se llevó a cabo una revisión bibliográfica en las bases de datos Scopus, Web of Science, ACM Digital Library, IEEE Xplore y Scielo, entre mayo y agosto de 2025, lo que dio como resultado la selección y el análisis de 35 artículos. Los resultados revelan que los estudios se centran en cuatro categorías: (i) reconocimiento de voz; (ii) síntesis de voz y personalización; (iii) experiencias basadas en la voz; y (iv) IA generativa y LLM. Se observó que predominan los estudios técnicos centrados en el reconocimiento automático del habla y la síntesis de voz, mientras que las experiencias basadas en la voz y las aplicaciones LLM aún están emergiendo, lo que indica las tendencias futuras. Los audiolibros también se utilizan con frecuencia como corpus técnicos para el desarrollo de modelos, con pocos estudios centrados en mejorar directamente la experiencia del usuario, además de la escasez de investigaciones en el campo de la ciencia de la información. Se puede concluir que, a pesar de los avances recientes, existen lagunas relacionadas con la falta de estudios centrados en el usuario, el uso predominante de audiolibros como corpus técnico y la escasa atención prestada a los aspectos éticos y sociales. Esta visión general proporciona un apoyo teórico y práctico para futuras investigaciones en este ámbito.
The use of Artificial intelligence (AI) techniques in the context of audiobooks has expanded the possibilities for accessibility, personalization and immersion, covering aspects from voice recognition and synthesis to interactive multimodal experiences and personalized recommendations, in addition to enhancing content retrieval and expanding access to information. This study aimed to identify studies on the use of AI in audiobooks in the academic literature. To this end, a literature review was conducted in the Scopus, Web of Science, ACM Digital Library, IEEE Xplore and Scielo databases, between May and August 2025, resulting in the selection and analysis of 35 articles. The results reveal that the studies focus on four categories: (i) speech recognition; (ii) voice synthesis; and personalization; (iii) voice-based experiences; and (iv) generative AI and LLMs. It was observed that technical studies focused on Automatic Speech Recognition and Voice Synthesis predominate, while voice-based experiences and LLM applications are still emerging, indicating future trends. Audiobooks are also frequently used as technical corpora for model development, with few studies focused on directly improving the user experience, in addition to a scarcity of research in the field of Information Science. It can be concluded that, despite recent advances, there are gaps related to the lack of user-centered studies, the predominant use of audiobooks as a technical corpus as well as few ethical and social aspects. This overview provides theoretical and practical support for future research in the area.
O uso de técnicas de Inteligência artificial (IA) no contexto dos audiolivros tem ampliado as possibilidades de acessibilidade, personalização e imersão, permitindo desde o reconhecimento e a síntese de voz até experiências multimodais interativas e recomendações personalizadas, além de potencializar a recuperação de conteúdo e ampliar o acesso à informação. Este estudo teve como objetivo identificar, na literatura acadêmica, estudos sobre o uso da IA em audiolivros. Para tanto, foi realizada uma revisão de literatura nas bases Scopus, Web of Science, ACM Digital Library, IEEE Xplore e Scielo, entre maio e agosto de 2025, resultando na seleção e análise de 35 artigos. Os resultados revelam que os trabalhos concentram-se em quatro categorias: (i) reconhecimento de fala; (ii) síntese de voz e personalização; (iii) experiências baseadas em voz; e (iv) IA generativa e LLMs. Observou-se que predominam estudos técnicos voltados para o Reconhecimento Automático de Fala e Síntese de Voz, enquanto experiências baseadas em voz e aplicações de LLMs ainda aparecem de forma emergente, indicando tendências futuras. Os audiolivros também são frequentemente utilizados como corpus técnico para o desenvolvimento de modelos, com poucos estudos voltados à melhoria direta da experiência de uso, além de uma escassez de pesquisas na área da Ciência da Informação. Conclui-se que, apesar dos avanços recentes, há lacunas relativas à falta de estudos centrados no usuário e ao uso predominante dos audiolivros como corpus técnico, assim como poucos aspectos éticos e sociais. Este panorama oferece subsídios teóricos e práticos para pesquisas futuras na área.
© 2001-2026 Fundación Dialnet · Todos los derechos reservados