Ayuda
Ir al contenido

Dialnet


Resumen de Sistema de recomendación para la recuperación automática de enlaces web rotos

Juan Martínez Romo, Lourdes Araujo

  • español

    Tanto en las páginas Web a las que accedemos cuando navegamos por Internet, como en las nuestras propias, a veces encontramos enlaces que han dejado de ser válidos. A menudo la búsqueda de la página que correspondía a dichos enlaces no es sencilla. En este trabajo investigamos distintas formas de recuperar automáticamente dichas páginas, de manera que le podamos ofrecer al usuario una lista de direcciones Web candidatas para sustituir el enlace roto. Concretamente utilizamos de forma alternativa o combinada, dependiendo de las características de la página y del enlace, el texto del ancla e información extraída de la Web en la que se encuentra el enlace roto. La información extraída de estas fuentes se utiliza para realizar una consulta con un motor de búsqueda usual, como Google o Yahoo. El sistema ordena posteriormente las páginas recuperadas en base a su contenido, utilizando técnicas de recuperación de información, y finalmente el resultado es presentado al usuario. Presentamos los resultados del análisis realizado sobre numerosos enlaces seleccionados aleatoriamente, los cuales nos han permitido decidir en qué condiciones es posible hacer una recomendación con un alto grado de fiabilidad.

  • English

    In the Web pages accessed when navigating through Internet or even in our own Web pages, we sometimes find links which are not valid any more. The search of the right Web pages which correspond to those links is often hard. In this work we have analyzed different sources of information to automatically recover broken Web links so that the user can be offered a list of possible pages to substitute that link. Specifically, we have used either the anchor text or the Web page containing the link, or a combination of both. The information extracted is then used to perform a search with some of the usual search engines, such as Google or Yahoo. The candidate pages are then ranked applying information retrieval techniques on their content. Finally, the user is presented the pages resulting from this process. We report the analysis of a number of issues on a set of links randomly chosen, what has allowed us to decide the conditions under which the system can make a reliable recommendation.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus