Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/14726
Título: | Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla |
---|---|
Título alternativo: | A semi-supervised learning method for semantic modeling in language understanding |
Autor/es: | Ortega Álvarez, Lucía | Galiano Ronda, Isabel Remedios | Hurtado Oliver, Lluís Felip | Sanchis Arnal, Emilio | Segarra Soriano, Encarnación |
Palabras clave: | Comprensión del habla | Clasificación semántica | Modelización estadística | Spoken language understanding | Semantic classification | Statistical modelization |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | oct-2010 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | ORTEGA ÁLVAREZ, Lucía, et al. “Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948 |
Resumen: | En este artículo presentamos un algoritmo para el aprendizaje estadístico de modelos semánticos, a partir de un corpus no alineado de pares de frases y su representación semántica en términos de frames. El objetivo final es poder asociar automáticamente segmentos de longitud variable con sus correspondientes unidades semánticas para ser usados en tareas de comprensión de habla. Una de las ventajas de esta aproximación consiste en evitar el costoso trabajo de segmentar y etiquetar todo el corpus de aprendizaje, como necesitan la mayor parte de los métodos basados en corpus. Por otra parte, resulta de especial interés la capacidad de aprendizaje discriminativo que presenta este método. Hemos aplicado este algoritmo al desarrollo del módulo de comprensión de un sistema de diálogo hablado, cuya tarea es el acceso a información sobre trenes. Se presentan experimentos que confirman lo adecuado del método, dado el ahorro de esfuerzo en la preparación del corpus. | In this paper we present a algorithm for the statistical learning of semantic models, based on a corpus of unaligned pairs of sentences and semantic representations in terms of frames. The objective is automatically associate variable-length segments with their corresponding semantic labels to be used in speech understanding tasks. One advantage of this approach is to avoid the expensive work of segmenting and labeling the whole training corpus, process which is needed by almost all the corpus based methods. Moreover, the discrimination learning ability of this method is specially interesting. We have applied this algorithm to the development of the understanding module of a spoken dialog system, whose task is the access to information about trains. We present experiments that confirm the appropriateness of the methodology. |
Patrocinador/es: | Trabajo parcialmente subvencionado por el gobierno español con el proyecto TIN2008-06856-C05-02. |
URI: | http://hdl.handle.net/10045/14726 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 45 (2010) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_45_24.pdf | 113,48 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.