Ayuda
Ir al contenido

Dialnet


Resumen de Importância do controle de vocabulário em um repositório institucional: Estudo de caso

Isidoro Gil Leiva, Isaque Katahira, Mariângela Spotti Lopes Fujita

  • Os Repositórios Institucionais armazenam expressivas quantidades de recursos edocumentos digitais relacionados a produções acadêmicas e/ou científicas. Assim, abusca e o acesso temático por meio de assuntos ou palavras-chave desempenha um papelmuito importante para facilitar a busca e o acesso as informações armazenadas nosRepositórios Institucionais. Para que a recuperação de documentos ocorra de modoefetivo, faz-se necessário padronizar esse sistema de indexação, para minimizar osruídos intrínsecos da linguagem natural, como ambiguidades, sinonímias e inadequaçõesde registros e ampliar a convergência entre a linguagem natural dos usuários e os vocabulárioscontrolados disponibilizados no arquivamento e organização dos repositórios.Neste contexto, o estudo aqui apresentado têm como objetivos: analisar o RepositórioInstitucional da Unesp do ponto de vista da utilização de vocabulário em linguagemnatural e em linguagem controlada; analisar a lista de assuntos disponível no Repositório;e explorar possibilidades oferecidas pela análise de logs de buscas dos usuários paraatualização de vocabulários controlados. Metodologia: Para tanto, realizou-se umapesquisa bibliográfica no Banco de Dados Scopus sobre repositórios e o uso de logs paracriar e atualizar vocabulários controlados. Posteriormente, realizamos uma análise dalista alfabética em linguagem natural disponibilizada pelo Repositório da Unesp aos seususuários para auxiliar na buscar por informações. Por fim, foi realizada a coleta de logsde busca dos usuários do Repositório Institucional da Unesp. O conjunto de dados inicialutilizado na análise continha 480.742 registros de logs, armazenados no período de01/07/2019 a 31/12/2019. Resultados/ Conclusões: a análise realizada, revela que oRepositório Unesp adota a linguagem natural sem nenhum controle de vocabulário ouuso de instrumentos de padronização; nas listas de palavras-chave indexadas dos documentos,observamos que não há controle de vocabulário o que resulta em uma lista comvariações terminológicas que podem prejudicar a recuperação da informação. Dentre osproblemas estão variações de singular ou plural, digitação com maiúscula ou minúscula,uso de aspas e outros sinais como hífen. Através da análise realizada neste estudo,análise de logs, foi possível obter, uma lista de expressões de busca contendo palavrassimples, palavras compostas ou frases para possibilitar a criação ou atualização de umvocabulário controlado. A metodologia aqui apresentada mostrou-se eficaz pois, permitiuuma grande depuração de expressões de busca de usuários que produziu um corpusterminológico proveniente diretamente da linguagem utilizada nesse sistema. A lista depalavras-chave e a análise de logs podem oferecer possibilidades de criação e manutençãode ferramentas de controle de vocabulário, desde a lista alfabética de palavras-chavee até tesauros, mas precisam passar por rigoroso controle terminológico e linguísticopara o aproveitamento.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus