Ayuda
Ir al contenido

Dialnet


Resumen de Técnicas de automatización web para fuentes de la web 2.0

Paula Montoto

  • La mayoría de las fuentes web al ser diseñados para ser fácilmente utilizados por humanos, no proporcionan interfaces adaptados a programas software para interactuar con ellos. Recientemente, ha aparecido un gran interés en la automatización de interacciones con un sitio web mediante la utilización de aplicaciones de automatización web. Muchos investigadores han propuesto técnicas para resolver este problema. La mayoría de las técnicas propuestas se han enfocado en la utilización de wrappers que abstraen las complejidades involucradas en la automatización de una tarea en una fuente web y proporcionan un interfaz a aplicaciones externas.

    Sin embargo, todavía predominan las soluciones ad-hoc en aplicaciones de automatización web. Una de la razones que motivan esta situación es que la mayoría de las propuestas se han enfocado en los wrappers de consulta, que transforman una fuente web en un tipo especial de base de datos en la cual algunas consultas pueden ser ejecutadas utilizando un formulario de consulta y devuelven un conjunto de resultados compuestos de registros de datos estructurados. Aunque el modelo de wrapper de consulta es a menudo útil, no es apropiado para aplicaciones que toman decisiones en función de los datos obtenidos o para procesos que utilizan formularios que pueden ser modelados como operaciones insert/update/delete.

    Por otro lado, una parte crucial en las aplicaciones de automatización web es permitir fácilmente generar y más tarde reproducir secuencias de navegación. El problema fue abordado en algunos trabajos pero esos sistemas asumen un modelo de navegación que es ahora obsoleto. Ese modelo obsoleto sólo permite acciones de usuario muy restrictivas (principalmente clics en elementos, establecer textos en campos de formularios y seleccionar opciones en menús de selección) y asume que el efecto de la mayoría de dichas acciones será únicamente la carga de una nueva página en el navegador.

    Con la aparición de la Web 2.0, los sitios web intentan parecerse cada vez más a aplicaciones de escritorio: se puede responder a un mayor número de acciones de usuario (situarse con el ratón encima de un elemento, arrastrar y soltar un elemento, ...) ejecutando código arbitrario que manipula el contenido de la página. Adicionalmente, la tecnología AJAX permite solicitar información al servidor web en un formato independiente de la presentación como XML o JSON y modificar sólo ciertas partes de la página actual en base a la respuesta recibida. Esto hace que muchos de estos sitios web queden fuera del soporte ofrecido por los Sistemas de Navegación Automática existentes en la actualidad. Por ese motivo, aparece la necesidad de definir nuevas técnicas que permitan construir un sistema de navegación web automático capaz de manejar toda la complejidad de los sitios web 2.0.

    Los objetivos de la presente tesis son, definir un nuevo lenguaje para la definición de procesos de automatización web basado en el estudio de un amplio rango de tareas de automatización web del mundo real que han sido utilizadas por corporaciones pertenecientes a diferentes áreas de negocio. Y por otro lado, se pretende abordar el problema de generar y reproducir automáticamente las acciones complejas con sitios web de última generación. Por último, para validar las ideas propuestas, se implementará un prototipo funcional.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus