Tomando uma amostra de 48 documentos publicados sobre a Bibliometria Brasileira, de 1973 a 2020, são analisadas as características textuais dessa literatura publicada. Foram utilizadas técnicas de mineração de textos, com foco principalmente na identificação da frequência de uso dos termos com o pacote tm de R. O algoritmo Latent Dirichlet Allocation (LDA) agrupou os documentos da amostra em 5 tópicos diferentes com a identificação das palavras mais recorrentes em cada assunto agrupado. Essas questões são mostradas com a construção de um dendrograma relevante e adequado para os documentos. A análise de clusteres com o algoritmo correspondente ao método de Ward identificou três clusteres homogêneos. Finalmente, foi construída uma rede de relações das palavras ou tokens dos 48 documentos analisados neste trabalho.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados