Normalización automática de registros obtenidos de la Web of Science

Antonio Eleazar Serrano López; Carmen Martín Moreno

Ayuda

Normalización automática de registros obtenidos de la Web of Science

Autores: Antonio Eleazar Serrano López, Carmen Martín Moreno
Localización: Aula abierta, ISSN 0210-2773, Vol. 40, Nº 2, 2012, págs. 65-74
Idioma: español
Títulos paralelos:
- Automatic normalization of records from the Web of Science
Enlaces
- Texto completo (pdf)

Dialnet Métricas: 1 Cita

Resumen
- español
  Los lenguajes de programación orientados al tratamiento automático de textos ya han demostrado anteriormente su utilidad para procesar y gestionar los registros bibliográficos obtenidos de diferentes bases de datos. Concretamente el lenguaje Perl ha sido utilizado en numerosas metodologías relacionadas con la bibliometría, para extraer los diferentes elementos de los registros bibliográficos, incorporarlos a bases de datos relacionales, procesarlos y obtener de ellos múltiples indicadores. Este trabajo tiene como objetivo el desarrollo de un sistema de normalización de datos, basado en scripts de Perl y en algoritmos de similaridad, que nos permitan realizar una normalización básica sobre los nombres de autor, direcciones y palabras clave procedentes de los registros obtenidos a través de la Web of Science. El procedimiento posee un margen de error muy pequeño y es especialmente eficiente en los nombres de instituciones, permitiendo eliminar más del 60% de la redundancia en este campo, un 10% en el caso de los nombres de autor y alrededor de un 50% en cuanto a las palabras clave.
- English
  Automatic normalization of records from the Web of Science. Programming languages focused on automatic text processing have previously demonstrated their utility to process and manage bibliographic records obtained from different databases. Specifically, Perl has been used in many methodologies related to bibliometrics to extract the different elements of bibliographic records, incorporate them to relational databases, and process them to get multiple indicators. This work aims to develop a normalization system based on Perl scripts and similarity algorithms, which allow us to perform a basic normalization of author names, addresses and keywords from records obtained through Web of Science. The procedure has a very small margin of error and is especially efficient in the names of institutions, eliminating more than 60% of the redundancy in this field, 10% in the case of the author�s names and about 50% on the keywords.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: