Ayuda
Ir al contenido

Dialnet


¿De qué temas hablamos en JENUI?: Modelado de topics con Latent Dirichlet Allocation (LDA)

  • Autores: Raúl Marticorena Sánchez, Carlos López Nozal, José Miguel Ramírez Sanz, José Luis Garrido Labrador
  • Localización: Actas de las Jornadas sobre la Enseñanza Universitaria de la Informática (JENUI), ISSN 2531-0607, Nº. 9 (Actas de las XXX Jornadas sobre Enseñanza Universitaria de la Informática (La Coruña, 19, 20 y 21 de), 2024, págs. 133-140
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      Las Jornadas en Enseñanza Universitaria en Informática (JENUI) se han venido desarrollando a lo largo de tres décadas, desde el año 1994 a la actualidad. En dicho periodo, la temática abordada ha evolucionado, cambiando el ámbito y tema de los trabajos, en función del progreso de la informática y su enseñanza en el ámbito universitario. La técnica de aprendizaje no supervisado sobre texto, denominada modelo de temas (topic model), mejora la comprensión de grandes cantidades de datos textuales agrupando los documentos en temas. El presente trabajo aplica esta técnica procesando las actas completas de JENUI con sus 1745 documentos. Partiendo de la extracción del texto de títulos y resúmenes, se aplica el algoritmo de Latent Dirichlet Allocation (LDA), estimando el número óptimo de temas. El trabajo construye un clasificador temático con los artículos de JENUI. Además, analiza la distribución de temas y las probabilidades de los términos de cada tema junto con la evolución temática de los trabajos a largo del tiempo. Desde una perspectiva más objetiva y científica, se concluye que existe una evolución temática, a lo largo de las 27 ediciones con actas de JENUI.

    • English

      The JENUI (Jornadas en Enseñanza Universitaria en Informática) have been held for three decades, from 1994 to the present day. During this period, the subject matter has evolved, changing the scope and topic of the papers, depending on the progress of computer science and its teaching at university level. The unsupervised text-based learning technique, known as the topic model, improves the understanding of large amounts of textual data by grouping documents into topics. This paper applies this technique by processing the complete proceedings of JENUI with its 1745 documents. Starting from the extraction of text from titles and abstracts, the Latent Dirichlet Allocation (LDA) algorithm is applied, estimating the optimal number of topics. The work constructs a topic classifier with the JENUI articles. In addition, it analyses the distribution of topics and the probabilities of the terms of each topic together with the topic evolution of the papers over time. From a more objective and scientific perspective, it is concluded that there is a thematic evolution over the 27 editions with JENUI proceedings.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno