El perfilamiento e identificación de autores son campos de la lingüística computacional que han ganado mucha relevancia en los últimos años gracias a sus potenciales aplicaciones prácticas en el campo de la lingüística forense o a la verificación de autoría de textos históricos.
El perfilamiento de autores tiene como objetivo identificar información demográfica de los autores; la identificación de autores trata de identificar el autor de un texto.
Para hacer estas tareas, buscamos automáticamente patrones lingüísticos que diferencien entre autores y entre autores con diferentes características demográficas (género, edad, orientación sexual, etc.).
La gran mayoría de trabajos anteriores se centran en el contenido de los textos. Nosotros argumentamos que analizar la estructura del texto puede ser una alternativa más efectiva. El foco de esta tesis, por tanto, está en el "feature engineering": la extracción, evaluación y utilización de un conjunto de características lingüísticas con algoritmos de aprendizaje automático para perfilar/identificar autores. Demostramos que las características sintácticas y discursivas son relevantes y que combinadas con otras, obtenemos resultados a la altura del estado del arte.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados