Reentrenamiento: aprendizaje semisupervisado de los sentidos de las palabras

Manuel Palomar Sanz; Germán Rigau Claramunt; Armando Suárez Cueto

Ayuda

Reentrenamiento: aprendizaje semisupervisado de los sentidos de las palabras

Autores: Manuel Palomar Sanz, Germán Rigau Claramunt, Armando Suárez Cueto
Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 34, 2005, págs. 49-66
Idioma: español
Enlaces
- Texto completo
Resumen
- español
  Este artículo presenta un algoritmo iterativo-incremental, Reentrenamiento, que adquiere de forma automática nuevos ejemplos anotados semánticamente, asegurando una alta precisión. El algoritmo se inscribe dentro de los métodos de aprendizaje automático basados en corpus y usa los modelos de probabilidad de máxima entropía. Reentrenamiento consiste en la retroalimentación del corpus de entrenamiento, mediante sucesivos ciclos de aprendizaje y clasificación, con nuevos ejemplos clasificados con un grado alto de confianza. Este nuevo método se inspira en los algoritmos de coentrenamiento (co-training) pero asumiendo unas restricciones más fuertes a la boca de decidir qué ejemplos se etiquetan e incorporan a la siguiente iteración y cuáles no.
- English
  This paper presents re-training, a bootstrapping algorithm that automatically acquires semantically annotated data, ensuring high levels of precision. This algorithm uses a corpus-based system of word sense disambiguation that relies on maximum entropy probability models. The re-training method consists of the iterative feeding of training-classification cycles with new and high-confidence examples. The process relies on several filters that ensure the accuracy of the disambiguation by discarding uncertain classifications. This new method is inspired by co-training algorithms, but it makes stronger assumptions on when to assign a label to a linguistic contex

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: