Nuria Andión Rodríguez, Xavier Gómez Guinovart, José Luis Aguirre Moreno
En este trabajo se examinan algunos aspectos del etiquetado lingüístico de un corpus técnico de informática en lengua gallega, en lo que respecta a cuestiones ortográficas, léxicas y morfosintácticas. En primer lugar, presentamos la características del corpus analizado y algunas de las aplicaciones de su procesamiento. A continuación, mostramos las técnicas empleadas en su anotación morfosintáctica, centrándonos en la discusión de nuestra propuesta de etiquetario y en el esquema de codificación. Por último, presentamos una aproximación a los problemas específicos que plantea la anotación léxica, terminológica y ortográfica del corpus.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados