Ayuda
Ir al contenido

Dialnet


Grabbing parallel corpora from the Web

  • Autores: Alberto Manuel Brandâo, José Alves de Castro, José João Almeida
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 29, 2002 (Ejemplar dedicado a: XVII Congreso de la SEPLN. Universidad de Valladolid, 11-13 septiembre 2002), págs. 13-20
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      Los recursos multilingües son útiles para los estudios lingüísticos, para la traducción y para muchas otras tareas. Sin embargo, estos recursos son difíciles de obtener y de organizar. En este documento describimos un conjunto de herramientas diseñadas para ayudar en la tarea de extraer recursos bilingües de la Red que sirvan para construir corpora paralelos y memorias de traducción. Nuestro objetivo es construir herramientas que puedan ser compartidas o usadas de manera independiente.

    • English

      Multilingual resources are useful for linguistic studies, translation, and many other tasks. Unfortunately, these resources are difficult to obtain and organize. In this document we describe a set of tools designed to help in the task of mining bilingual resources from the web, from a specific site, from a file system, from a list of URLs, or from a translation memory. As a design goal we intend to build tools that can be used both cooperatively (in pipeline) and also in a independent way.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno