La búsqueda de datos tabulares en portales de datos y otros entornos presenta retos significativos debido a las limitaciones de los sistemas actuales, que suelen enfocarse en contenido textual o metadatos y no consideran adecuadamente la información contenida en los propios datos. Esto dificulta a los investigadores encontrar datos relevantes para sus necesidades. Para abordar este problema, se han desarrollado métodos basados en representaciones semánticas mediante word embeddings. Estos enfoques permiten relacionar problemas de investigación con tablas relevantes al calcular la similitud entre descripciones textuales y tablas. Asimismo, se han explorado estrategias para optimizar la representación de tablas grandes, reduciendo su contenido sin perder la calidad de las relaciones semánticas, lo que mejora la eficiencia en los sistemas de recuperación. Por otro lado, los grandes modelos de lenguaje (LLMs) han demostrado ser herramientas clave para mejorar algunos los catálogos de datos haciéndolos más reutilizables y cercanos a los principios FAIR. Finalmente, estos avances se han trasladado a la práctica a través de la creación de servicios innovadores en espacios de datos, como herramientas diseñadas específicamente para la búsqueda avanzada de tablas. Este proceso refleja cómo los resultados de investigación pueden transformarse en soluciones aplicadas que responden a necesidades concretas de análisis y recuperación de datos.
© 2001-2026 Fundación Dialnet · Todos los derechos reservados