Colombia
El objetivo de esta investigación fue desarrollar un laboratorio virtual para la gestión de datos de biodiversidad en la región del Pacífico colombiano. La plataforma creada integra una base de datos relacional en PostgreSQL, el ecosistema JupyterHub y servicios de Amazon Web Services (AWS), con infraestructuras de datos globales. Se recopilaron 28.058 registros entre 2004 y 2022, destacando 44 familias, 119 géneros y 198 especies, incluyendo, especies maderables amenazadas, como Carapa guianensis, Humiriastrum procerum y Magnolia calimaensis. Entre las familias con mayores registros se encuentran Fabaceae, Arecaceae, Malvaceae y Moraceae, con 88 especies en total. La ejecución de rutinas de trabajo no excedió los 11 minutos en Python y R. Los servicios de AWS demostraron tiempos de respuesta de 200 ms y un tráfico de red de 0.1 GB/s. El inicio y cese de contenedores se realizó en 10 y 5 segundos, con un uso promedio de CPU y RAM ,del 80 y 75%, respectivamente. Además, se almacenaron 4 GB de objetos con tiempos de respuesta inferiores a 100 ms. Con la ayuda de las herramientas implementadas se logró prevenir errores en los datos dasométricos y taxonómicos, destacando la importancia del control de calidad y la validación de datos. La implementación de este laboratorio virtual permitió un manejo eficaz de grandes volúmenes de datos, facilitando la colaboración en tiempo real entre investigadores y proporcionando una herramienta escalable y flexible para el análisis de datos ecológicos, promoviendo una comprensión más completa de la biodiversidad en la región.
The objective of this research was to develop a virtual laboratory for the management of biodiversity data in the Colombian Pacific Region. The platform created integrates a relational database in PostgreSQL, the JupyterHub ecosystem, and Amazon Web Services (AWS) services with global data infrastructures. 28058 records were collected between 2004 and 2022, highlighting 44 families, 119 genera, and 198 species, including threatened timber species such as Carapa guianensis, Humiriastrum procerum, and Magnolia calimaensis. Among the families with the most significant number of records are Fabaceae, Arecaceae, Malvaceae, and Moraceae, which have 88 species. The execution of work routines was at most 11 minutes in Python, and R. AWS services demonstrated response times of 200 ms and network traffic of 0.1 GB/s. The start and stop of containers were carried out in 10 and 5 seconds, with an average CPU and RAM usage of 80% and 75%, respectively. In addition, 4 GB of objects were stored with response times of less than 100 ms. With the help of the implemented tools, it was possible to prevent errors in the dasometric and taxonomic data, highlighting the importance of quality control and data validation. The implementation of this virtual laboratory allowed an efficient management of large volumes of data, facilitating real-time collaboration between researchers and providing a scalable and flexible tool for the analysis of ecological data, promoting a more complete understanding of biodiversity in the region.
© 2001-2026 Fundación Dialnet · Todos los derechos reservados