Ayuda
Ir al contenido

Dialnet


Construcción de un corpus escrito y una ontología de errores ortográficos del chabacano zamboangueño

    1. [1] Universidad Nacional de Educación a Distancia

      Universidad Nacional de Educación a Distancia

      Madrid, España

    2. [2] Universidad de Alcalá

      Universidad de Alcalá

      Alcalá de Henares, España

  • Localización: Revista española de lingüística aplicada, ISSN 0213-2028, Vol. 36, no. 1, 2023, págs. 234-269
  • Idioma: español
  • Enlaces
  • Resumen
    • El chabacano zamboangueño es una lengua criolla filipina, de base española, hablada como lengua materna por más de 400.000 personas (datos de 2010). No obstante, su grafía normalizada es relativamente reciente (de 2014). Este artículo presenta una investigación destinada a la identificación y anotación semiautomática de los errores cometidos por sus hablantes al escribir, según la ortografía normativa. En primer lugar, detallamos los criterios aplicados en la construcción de un corpus de más de 8 millones de palabras del zamboangueño escrito y los géneros que lo componen, así como los formatos utilizados para codificarlo. En segundo lugar, describimos el proceso seguido para (1) el estudio de los errores y problemas ortográficos presentes en este corpus; (2) el desarrollo de una taxonomía elaborada para su mejor representación y clasificación; y (3) su formalización mediante una ontología. Por último, discutimos el resultado principal de este trabajo: un corpus de zamboangueño escrito, con sus errores ortográficos clasificados y anotados semiautomáticamente con enlaces a la ontología y sus formas corregidas correspondientes. Estas anotaciones nos permitirán a corto plazo analizar de manera más sistemática y profunda las faltas de ortografía cometidas por los usuarios del zamboangueño.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno