Ayuda
Ir al contenido

Dialnet


Resumen de Combining machine learning and rule-based approaches in Spanish syntactic generation

Maite Melero Nogués

  • Aquesta tesi descriu una gramàtica de Generació que combina regles escrites a mà i tècniques daprenentatge automàtic. Aquesta gramàtica pertany a un sistema de Traducció Automàtica de qualitat comercial desenvolupat a Microsoft Research. La primera part presenta la gramàtica i les principals estratègies lingüístiques que aquesta gramàtica implementa. Els requeriments de robustesa que reclama lús real del sistema de TA, exigeix del Generador un esforç suplementari que es resol afegint un nivell de pre-generació, capaç de garantir la integritat de lentrada, sense incorporar elements ad-hoc en les regles de la gramàtica. A la segona part, explorem lús dels classificadors darbres de decisió (DT) per tal daprendre automàticament una de les operacions que tenen lloc al mòdul de pre-generació, en concret la selecció lèxica del verb copulatiu en espanyol (ser o estar). Mostrem que és possible inferir a partir dexemples els contextos per aquest fenòmen lingüístic no trivial, amb gran precisió.

    Resumen This thesis describes a Spanish Generation grammar which combines hand-written rules and Machine Learning techniques. This grammar belongs to a full-scale commercial quality Machine Translation system developed at Microsoft Research. The first part presents the grammar and the linguistic strategies it embodies. The need for robustness in real-world situations in the everyday use of the MT system requires from the Generator an extra effort which is resolved by adding a Pre-Generation layer which is able to fix the input to Generation, without contaminating the grammar rules. In the second part we explore the use of Decision Tree classifiers (DT) for automatically learning one of the operations that take place in the Pre-Generation component, namely lexical selection of the Spanish copula (i.e. ser and estar). We show that it is possible to infer from examples the contexts for this non-trivial linguistic phenomenon with high accuracy.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus