El dilema de las palabras vacías en la revisión humana del procesamiento automatizado

Autores/as

DOI:

https://doi.org/10.3145/infonomy.23.011

Palabras clave:

Palabras vacías, Diccionarios, Pre-procesamiento, Procesos manuales versus automatizados, Rol de los documentalistas

Resumen

Se discute la necesidad de pre-procesar los corpus de términos para eliminar las palabras vacías o stopwords, y se presenta el dilema de hacerlo manualmente o utilizando un sistema automatizado. Se sugiere que los documentalistas trabajen en la construcción de diccionarios y en la creación semiautomática de vocabularios específicos por dominios.

Biografía del autor/a

Fernanda Peset, Universitat Politècnica de València

Citas

Blasco-Gil, Yolanda; González, Luis M.; Pavón-Romero, Armando; Mercado-Estrada, Mariano; Pavón-Romero, Carlos; Cabrera, Ana M.; Garzón-Farinós, Fernanda; Peset, Fernanda (2020). “Enriqueciendo la investigación en humanidades digitales. Análisis de textos de claustros académicos de la Universidad de Valencia (1775-1779) con KH Coder”. Revista española de documentación científica, v. 43, n. 1, e257. https://doi.org/10.3989/redc.2020.S1

Burns, Collin; Izmailov, Pavel; Kichner, Jan H.; Baker, Bowen; Gao, Leo; Aschenbrenner, Leopold; Chen, Yining; Ecoffet, Adrien; Joglekar, Manas; Leike, Jan; Sutskever, Ilya; Wu, Jeff (2023). Weak to strong generalization: Eliciting strong capabilities with weak supervision. https://cdn.openai.com/papers/weak-to-strong-generalization.pdf

Calabuig, José-Manuel; Ferrer-Sapena, Antonia; Garcia-Raffi, Lluís-Miquel; Peset, Fernanda; Sánchez-Pérez, Enrique A.; Sánchez-Del-Toro, M. Isabel (2023). “Algoritmos matemáticos para una inteligencia artificial responsable, ética y transparente”. Revista Valenciana d’Estudis Autonòmics, n. 68, pp. 283-305. https://presidencia.gva.es/es/web/begv-gavina/politica/-/asset_publisher/MBYQ47LTEnde/content/revista-valenciana-d-estudis-autonomics

Descargas

Publicado

2023-12-30

Cómo citar

Peset, F. (2023). El dilema de las palabras vacías en la revisión humana del procesamiento automatizado. Infonomy, 1(1). https://doi.org/10.3145/infonomy.23.011

Número

Sección

Extensión