Te lleva a la página de inicioLA RECUPERACIÓN DE INFORMACIÓN EN SISTEMAS DE ALMACENAMIENTO DIGITAL

 por Yolanda de la Iglesia Sánchez

Abrir en ventana nueva

  

1.            INTRODUCCIÓN

 1.1.     Antecedentes y consideraciones generales 

            El adagio "una imagen vale más que mil palabras" puede servir de marco iniciático para introducir el paradigma electrónico que es la "realidad virtual".  Pero sólo introducirlo, porque ahora una imagen sin palabras que la describan, no tiene el mismo valor que antaño, y no sólo eso, sino que las mismas palabras se han tenido que volver imágenes para ser divulgadas.

             Eso ha ocurrido con el patrimonio bibliográfico y documental, que ha permanecido escondido y ha evolucionado a la zaga de otros patrimonios como el arquitectónico y el museístico. La gran difusión social del patrimonio cultural y su explotación como recurso económico en las industrias culturales se ha limitado al conocimiento de los dos últimos, hasta que el impacto de la llamada sociedad de la información se ha introducido en el mundo de los archivos, las bibliotecas y los centros de documentación.

             Nadie puede dudar que los archivos, las bibliotecas y los centros y redes de documentación se han abierto  a la dinámica de las tecnologías de la información, y se han convertido en el universo natural para la gestión del conocimiento. Todo esto ha conllevado un cambio en los sistemas de trabajo, una nueva definición de documento, una nueva gestión de la información y una intensificación del intercambio y acceso a la documentación.

             El proceso está abierto y  tiene su mejor manifestación en un fenómeno que podría denominarse "desmaterialización" del documento. Los documentos se empiezan a convertir en algo intangible, lo cual era impensable hasta ahora según la propia naturaleza de los mismos. El factor de intangibilidad lo ha proporcionado la nueva realidad virtual que ha revolucionado la accesibilidad al documento y por añadidura a la información.

             La disponibilidad de los documentos ha cambiado al someterlos al procesamiento electrónico, y la transmisión y la comunicación de los documentos entregadas a la aplicación de la nuevas tecnologías multimedia, hipermedia y realidad virtual se llevan a cabo sobre todo en el mundo de las redes.

             El entorno digital está siendo objeto de numerosos estudios e investigaciones, y como todos los fenómenos en sus primeras manifestaciones ya ha producido su dosis de confusión terminológica.

            En primer lugar se emplea el término "archivo" con gran asiduidad, para referirse a fondos documentales  de diversas materias y en distintos soportes, que no constituyen el genuino fondo de archivo articulado por el principio de procedencia. La acepción de archivo se toma como  conjunto de documentos, y es por ello que los sistemas de recuperación empleados no son los que se ajustarían a un sistema de información descriptiva, de almacenamiento electrónico organizado jerárquicamente de acuerdo a las reglas de descripción multinivel y de herencia establecidas por la norma ISAD(G).

            Cabe también referirse en este sentido a las expresiones "biblioteca digital", "biblioteca electrónica" y "biblioteca virtual", que además de su empleo indiscriminado, se suelen confundir entre ellas. La biblioteca digital implica el uso de las telecomunicaciones, el acceso puede ser remoto e independiente del lugar y número de conexiones. A diferencia de la virtual, la digital suele estar formada por un conjunto de conexiones a varias fuentes de información recogidas en Internet.      

1.2.            Hipótesis de trabajo

             El diseño y la gestión de los recursos electrónicos procedentes del patrimonio bibliográfico y documental parte de un proceso de digitalización de los documentos. Y es este proceso de transformación del soporte papel al soporte digital, el que me servirá de marco de referencia para estudiar aspectos relacionados con la conversión y el almacenamiento de los documentos y su manipulación en el entorno digital.

             El adelanto que supone iniciar un proceso de digitalización de documentos se manifiesta en dos propósitos sustanciales:      

            1.    La preservación  y conservación de  los documentos.

            2.    La difusión y accesibilidad de los documentos.

             La intención de este trabajo es centrarse exclusivamente en el segundo aspecto. Por ello el desarrollo de los argumentos de este estudio se fijarán en aquellos elementos de la digitalización que tienen que ver con la recuperación y la difusión de la documentación digitalizada, esto es, básicamente, el sistema de consulta.

             El estudio que aquí se plantea ha surgido a partir de la exploración de seis experiencias de digitalización diferentes, realizadas por distintas entidades, y con fondos documentales diversos. En estas experiencias en cuanto a los contenidos de sus fondos y de qué manera se ha resuelto su consulta, así como su presentación a los usuarios, se basa este trabajo.

             Para mucha gente el archivo digital o la biblioteca digital evoca la imagen de un gigantesco repositorio de información en línea, al cual los usuarios accederían a través de una búsqueda, cuyo final feliz sería conseguir su información [1].  Pero hasta el momento los principales problemas de recuperación surgen en este mismo punto de partida y se refieren a cómo encontrar la información en un entorno digital.

             El soporte digital es muy potente, pero es preciso organizar opciones amigables para facilitar la búsqueda de información y el acceso a los servicios que puede llegar a ofrecer.

             Los soportes digitales de información y los vehículos que la transportan, los servidores que la almacenan y los terminales que la transforman, son ya muy variados y todos ellos contribuyen al peculiar y novedoso fenómeno de la digitalización [2].

             En términos generales, es injusto y hasta desproporcionado reducir el mundo digital a la red Internet,  pero como paradigma del archivo virtual que ayuda a sustituir la autarquía documental por la cooperación, es una realidad constante en todos los recursos sobre archivos disponibles en la red.

             La Internet es una plataforma ideal para la materialización de la difusión de los fondos documentales, con la construcción de un web se puede ofrecer acceso a recursos propios, a recursos externos y a sistemas de recuperación internos y externos (motores de búsqueda).

             El requerimiento que supone la virtualidad en Internet ha provocado que las experiencias estudiadas estén en su mayor parte en la red. No obstante, quisiera destacar que en la selección de los ejemplos se ha tenido en cuenta la representación de otros entornos de trabajo para el usuario: entorno telemático (Internet), entorno monopuesto (CD-ROM comercializado) y entorno multipuesto (centro de investigación).

  1.3.            Objetivos:

             Las expectativas que se pretenden cubrir con la elaboración de esta investigación se concentran en un objetivo general, que es observar las consecuencias de la recuperación de información digital dentro de la estructuración de diferentes procesos de digitalización.

             Además de esta consideración general, hay que anotar también otros objetivos más concretos que son los que se exponen a continuación:

Objetivos específicos:

·        Recoger los requerimientos técnicos básicos y característicos de los procesos de digitalización (parámetros y sistemas de digitalización).

·        Evaluar la descripción y recuperación de documentos (sistemas de consulta).

·        Presentar diversas propuestas de edición y explotación de documentos electrónicos (sistemas de almacenamiento, sistemas de servicio de imágenes).

  

2.         MEDIOS

 Los medios empleados han sido varios, y variada ha sido también su utilización. Para realizar el presente trabajo me he servido de cuatro tipo de  materiales:

    1.     Recopilación de datos en los centros.

2.     Documentación facilitada por los centros.

3.     Páginas web de los productores.

4.     Bibliografía.

 

 La recopilación de datos en los propios centros ha sido sin duda la tarea más laboriosa por su preparación. Por su parte, las páginas web han servido para descubrir una serie de ventajas que ofrece el acceso digital, pero también a través de este entorno se percibe una sensación de novedad y de provisionalidad en la implementación de los proyectos, provocada muy probablemente por la propia naturaleza de la red. Los proyectos presentados en Internet están más basados en suposiciones que en realidades.

En cuanto al caso del almacenamiento y consulta en disco óptico, la información se ha extraído de la propia aplicación, así como de fuentes de información externas, pero complementarias sobre el producto y el productor concreto que nos ocupa.

             El análisis de la literatura sobre los procesos de digitalización  de los últimos años da una idea del crecimiento del interés por la gestión de los documentos en el entorno automatizado. En su origen, como todos las operaciones informáticas, la digitalización tenían atribuciones puramente técnicas y su razón de ser implicaba exclusivamente al profesional que las llevaba a cabo. Ahora estas consideraciones están cambiando,  al incluir al cliente-usuario como máximo exponente de los objetivos a conseguir al sumergirse en uno de estos proyectos.

 Cabe destacar una cierta división de los estudios según se refieran a bibliotecas digitales o archivos digitales. Raramente se localizan textos que traten el desarrollo de un plan de digitalización general. Parece claro pues que las características de los documentos y su sentido como colección diferencia al archivo de la biblioteca y viceversa. De momento existe cierta ventaja para las bibliotecas, las cuales ya han desarrollado plenamente una etapa imprescindible de normalización. Los archivos están a caballo entre la redacción de sus normas de descripción y el avance y empuje de la realidad virtual.

  Finalmente hay que hacer notar que existe todavía poca bibliografía específica sobre la recuperación específica de la información en la órbita digital. De momento, se han trasladado las referencias y los parámetros de evaluación de los sistemas automatizados de gestión de la información.

 

3.         MÉTODO

          En todo sistema de almacenamiento digital de imágenes cabe distinguir dos procesos fundamentales: el proceso de digitalización y almacenamiento y el proceso de consulta [3]. Como ya se ha indicado anteriormente,  serían específicamente el proceso de consulta y el formato de visualización de resultados, los elementos que interesan en nuestro caso.

 A.-            Recogida de datos

             Para enfrentarme con el estudio de los casos de digitalización que aquí se presentan he llevado a cabo dos tipos de actuación, a saber:

A1.Visitas a los centros digitalizadores

A2. Estudio de los productos a través de sus entornos de difusión: páginas web, y discos ópticos comercializados.

  

A1. Visitas a los centros:

     La idea de conocer los procesos de digitalización in situ, me pareció bastante interesante desde el momento en que surgió la posibilidad de realizar este estudio. Se trataba de "poner una cara" a uno de tantos mecanismos que conocemos en sus resultados, pero que no se suele tener la opción de contemplar directamente.

    Para realizar esas visitas, desarrollé un plan de trabajo con las consideraciones y los datos que a primera vista exigía el conocimiento de los centros digitalizadores. Así, elaboré unas pautas para tener un control y obtener un aprovechamiento óptimo de las entrevistas con los responsables.

      El Plan de trabajo  seguido se detalla a continuación:

I. INFORMACIÓN GENERAL:

II. PROYECTO DE DIGITALIZACIÓN:

Fechas de inicio/ finalización.

II. 1. Aspectos del proyecto de digitalización:

1.     Plan de desarrollo global que determine los objetivos globales del sistema y defina el proyecto y las prioridades. Un PDG con:

2. Análisis de sistemas. Objetivos y requisitos específicos. Estudio de viabilidad.

3. Especificación de los requisitos. Objetivos y requisitos del propio proyecto.

4. Evaluación de sistemas. En qué medida los sistemas propuestos cumplían los requisitos, y por qué se solicitó un producto existente, o se desarrolló un nuevo sistema.

5. Puesta en marcha. Control de la instalación del sistema elegido.

6. Control y mantenimiento. Revisión continua y mejora del sistema

II.2. Fase de planificación

II.3. Fase de selección:

Qué sistema se escogió y por qué.

II.4.   Fase de implantación

III. EQUIPO INFORMÁTICO:

III.1.   Tipo de programas de aplicación y características:

IV.   CONCLUSIONES:

Comentarios sobre los efectos conseguidos tras la digitalización, situación actual, ventajas, desventajas: revisión del fondo, manipulación del fondo original favoreciendo la preservación y conservación; trabajo del personal; difusión de los fondos (CD-ROM, intercambio con otras bibliotecas);  servicio rápido; mejora de las posibilidades de lectura (tratamiento de originales); reproducciones rápidas (mejoran el original); sistemas automatizados accesibles por Internet.

 

A2. Estudio de los productos a través de los entornos de difusión

A la hora de observar las experiencias a través de los resultados, se ha tenido en cuenta la diferencia de planteamiento y la dificultad de equiparar y nivelar los tipos de información obtenidos cuando el contacto con el centro digitalizador ha sido directo.

En las experiencias volcadas en Internet, y en CD-ROM comercializado, se ha investigado en la documentación incluida en ambos estadios siguiendo un Método de estudio apropiado al soporte y medio de difusión.  El esquema de este método contempla los siguientes apartados:

1º  ESTUDIO DE LA PRESENTACIÓN Y CONTENIDOS DEL PROYECTO. Navegación por la web con una valoración de:

2º ANÁLISIS DEL SISTEMA DE BÚSQUEDA

a) La base de datos:

b) La recuperación de la información:

Capacidades de búsqueda del software de recuperación (para usuarios finales, para usuarios expertos y profesionales, o para ambos; operadores...).

3º ANÁLISIS DEL SISTEMA DE VISUALIZACIÓN

La interfaz de usuario: El acceso del usuario a la información: amigabilidad, fácil navegación, variedad en los formatos de salida, consistencia.

 

 B.- Presentación de los resultados

Partiendo de estas dos formas de trabajo, he confeccionado a su vez un subsistema de presentación del estudio de cada experiencia, producido tras la elaboración de una sinopsis que contiene los puntos que son objeto de esta investigación, y que se dividen en cinco aspectos, que sirven para describir y distinguir cada una de las experiencias.        

A partir del procesamiento de los datos obtenidos por uno y otro método, el  marco de presentación comprende los siguientes exponentes:

 I.            Descripción del centro y de sus fondos: en este punto se esbozan los aspectos generales sobre el centro digitalizador (historia y evolución del centro) y los fondos que alberga (materias, volumen, etc.).

 II.            Definición del proyecto de digitalización: con las premisas mínimas facilitadas por los centros.

 III.            Análisis del Sistema de consulta de los documentos: contiene los detalles de la observación de la recuperación de la información digitalizada.

 IV.            Descripción del Sistema de visualización de los documentos: donde se da noticia de la presentación de los documentos en pantalla.

 V.            Relación de las Características específicas del proyecto: enumeración de las peculiaridades que cabe distinguir en cada experiencia.

  

4.         ANÁLISIS DE EXPERIENCIAS

 

5.         RESULTADOS Y CONCLUSIONES

             Como reflexiones finales sobre lo desarrollado en este trabajo, voy a plantear los puntos que considero fundamentales y que representarían el sentido y la realización de un proyecto de digitalización,  qué se consigue y  para qué. Por otro lado se señalan algunas estimaciones sobre la situación de los sistemas de consulta y de visualización de los documentos. A través de las valoraciones de las experiencias descritas y analizadas, cabe ahora desgranar algunas conclusiones finales que responden a su vez a una serie de interrogantes.

 

5.1. Objetivos y propósitos posibles de la digitalización

 A)        ¿POR QUÉ UTILIZAR EL SOPORTE DIGITAL?

 

B)  ¿QUÉ BENEFICIOS OBTIENE EL USUARIO/INVESTIGADOR?

 C) ¿QUÉ VENTAJAS PROPORCIONA AL CENTRO DIGITALIZADOR?

 

5.2.  Desarrollo de los sistemas de consulta

5.3.   Situación de los sistemas de visualización

NOTAS

BIBLIOGRAFÍA

PROYECTO CLÍO