Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/14726
Información del item - Informació de l'item - Item information
Título: Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla
Título alternativo: A semi-supervised learning method for semantic modeling in language understanding
Autor/es: Ortega Álvarez, Lucía | Galiano Ronda, Isabel Remedios | Hurtado Oliver, Lluís Felip | Sanchis Arnal, Emilio | Segarra Soriano, Encarnación
Palabras clave: Comprensión del habla | Clasificación semántica | Modelización estadística | Spoken language understanding | Semantic classification | Statistical modelization
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: oct-2010
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: ORTEGA ÁLVAREZ, Lucía, et al. “Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948
Resumen: En este artículo presentamos un algoritmo para el aprendizaje estadístico de modelos semánticos, a partir de un corpus no alineado de pares de frases y su representación semántica en términos de frames. El objetivo final es poder asociar automáticamente segmentos de longitud variable con sus correspondientes unidades semánticas para ser usados en tareas de comprensión de habla. Una de las ventajas de esta aproximación consiste en evitar el costoso trabajo de segmentar y etiquetar todo el corpus de aprendizaje, como necesitan la mayor parte de los métodos basados en corpus. Por otra parte, resulta de especial interés la capacidad de aprendizaje discriminativo que presenta este método. Hemos aplicado este algoritmo al desarrollo del módulo de comprensión de un sistema de diálogo hablado, cuya tarea es el acceso a información sobre trenes. Se presentan experimentos que confirman lo adecuado del método, dado el ahorro de esfuerzo en la preparación del corpus. | In this paper we present a algorithm for the statistical learning of semantic models, based on a corpus of unaligned pairs of sentences and semantic representations in terms of frames. The objective is automatically associate variable-length segments with their corresponding semantic labels to be used in speech understanding tasks. One advantage of this approach is to avoid the expensive work of segmenting and labeling the whole training corpus, process which is needed by almost all the corpus based methods. Moreover, the discrimination learning ability of this method is specially interesting. We have applied this algorithm to the development of the understanding module of a spoken dialog system, whose task is the access to information about trains. We present experiments that confirm the appropriateness of the methodology.
Patrocinador/es: Trabajo parcialmente subvencionado por el gobierno español con el proyecto TIN2008-06856-C05-02.
URI: http://hdl.handle.net/10045/14726
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 45 (2010)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_45_24.pdf113,48 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.