Generación de datos sinteticos para evaluar la enfermedad infecciosa leucosis bovina

Autores/as

DOI:

https://doi.org/10.24054/rcta.v1i41.2556

Palabras clave:

Aprendizaje automático, Enfermedades infecciosas bovinas, Datos sintéticos, Leucosis

Resumen

Los proyectos que se desarrollan en el sector de salud animal se enfrentan a limitaciones tecnológicas y científicas debido a la falta de información consistente y confiable, y a los altos costos que supone la recolección de información para los ganaderos. Así mismo, las limitaciones jurídicas en la divulgación de información por razones como las leyes de protección de datos conllevan atrasos en el desarrollo de políticas y estrategias, lo mismo que en la toma de decisiones. Ante esta falta de disponibilidad de información surge como solución la generación de datos sintéticos a partir de un conjunto de datos originales. Así, en este artículo se presenta un estudio a través del cual se valoraron tres métodos para generar datos sintéticos que reflejan el comportamiento de una enfermedad bovina en un conjunto de datos reales. El trabajo se basó en comparar algoritmos de aprendizaje automático, herramientas y métodos basados en modelos para mejorar el realismo de los datos sintéticos referidos al comportamiento de la enfermedad. El objetivo trazado fue encontrar el mejor modelo para la generación de datos sintéticos utilizando el caso de la enfermedad infecciosa mastitis bovina, ya que no se cuenta con suficientes datos sobre ella. Para validar los datos sintéticos fue necesario contrastar el conjunto de datos original y la información sintética, en busca de que el método seleccionado generara datos sintéticos con cualidades similares a las del conjunto de datos original.

Citas

Andrade Becerra, R., Caro Carvajal, Z., Pulido Medellín, M., Porras Vargas, J., & Vargas Abella, J. (2014a). Prevalencia de bacterias causantes de mastitis en fincas lecheras de Toca (Boyacá, Colombia). Ciencia y Agricultura, 11, 47–53.

Andrade Becerra, R., Caro Carvajal, Z., Pulido Medellín, M., Porras Vargas, J., & Vargas Abella, J. (2014b). Prevalencia de bacterias causantes de mastitis en fincas lecheras de Toca (Boyacá, Colombia). Ciencia y Agricultura, 11, 47–53.

Ballesteros-Ricaurte, J.-A., Avendaño-Fernández, E., González-Amarillo, A.-M., & Granados- Comba, A. (2021a). Mapeo científico en la búsqueda de información. Caso de estudio: enfermedades infecciosas en bovinos. Revista Científica, 42(3), 265–275. https://doi.org/10.14483/23448350.17532

Ballesteros-Ricaurte, J.-A., Avendaño-Fernández, E., González-Amarillo, A.-M., & Granados- Comba, A. (2021b). Mapeo científico en la búsqueda de información. Caso de estudio: enfermedades infecciosas en bovinos. Revista Científica, 42(3), 265–275. https://doi.org/10.14483/23448350.17532

Goncalves, A., Ray, P., Soper, B., Stevens, J., Coyle, L., & Sales, A. P. (2020). Generation and evaluation of synthetic patient data. BMC Medical Research Methodology, 20(1), 1–40. https://doi.org/10.1186/s12874-020-00977-1

González Martínez, E. F. (2021). Generador de datos sintéticos para el monitoreo de transacciones con factores de riesgo de lavado de activos. (Tesis de Maestría). (Universida).

Goodfellow, I., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., & Bengio, Y. (2020). Generative adversarial networks. Communications of the ACM, 63(11), 139–144. https://doi.org/10.1145/3422622

Lopez-Martin, M., Carro, B., & Sanchez-Esguevillas, A. (2018a). Variational data generative model for intrusion detection. Knowledge and Information Systems, 60(1), 569–590. https://doi.org/10.1007/s10115-018-1306-7

Lopez-Martin, M., Carro, B., & Sanchez- Esguevillas, A. (2018b). Variational data generative model for intrusion detection. Knowledge and Information Systems, 60(1), 569–590. https://doi.org/10.1007/s10115-018-1306-7

MOSTLY AI Inc. (n.d.). Mostly. 2020. Retrieved October 20, 2020, from https://mostly.ai

Olmedo Vélez, V., & Narváez Tello, C. (2021). Generación de un conjunto de datos sintéticos mediante técnicas de aprendizaje automático para análisis de fraude (Trabajo de grado) (E.P. Nacional, Ed.; Escuela Po).

Ordóñez, H., Cobos, C., & Bucheli, V. (2020). Machine learning model for predicting theft trends in Colombia. RISTI - Revista Iberica de Sistemas e Tecnologias de Informacao, 2020(E29), 494–506.

Pulido-Medellín, M., González-Ariza, W., Bayona- Ríos, H., & Chavarro-Tulcán, G. (2017a). Determinación de Leucosis enzootica bovina mediante las claves Hematológicas de Göttigen y Elisa en Boyacá. Rev. Fac.Cs. Vets., 58(1), 10–16.

Pulido-Medellín, M., González-Ariza, W., Bayona- Ríos, H., & Chavarro-Tulcán, G. (2017b). Determinación De Leucosis enzoótica Bovina meDiante Las cLaves HematoLógicas De göttingen y eLisa en Boyacá, coLomBia Enzootic Bovine Leukosis Assessment by Hematology Gottingen Keys and ELISA in Boyacá, Colombia. Rev. Fac. Cs. Vets., 58(1), 10–16.

Raschka, S., & Mirjalili, V. (2019). Python Machine Learning (Segunda Ed). Marcombo.

Shah, S., Gandhi, D., & Kothari, J. (2020). Machine learning based Synthetic Data Generation using Iterative Regression Analysis. In Fourth International Conference on Electronics, Communication and Aerospace Technology (pp. 1093–1100). https://doi.org/10.1109/ICECA49313.2020.9297491

Spositto, O., Blanco, G., Matteo, L., & Levi, M. (2020). SMOTE , Algoritmo para balanceo de clases en un estudio aplicado a la ganadería . XXVI Congreso Argentino de Ciencias de La Computación - CACIC, 289–298.

Surendra, H., & Mohan, H. S. (2017a). A Review Of Synthetic Data Generation Methods For Privacy Preserving Data Publishing. International Journal of Scientific & Technology Research, 6(3), 95–101.

Surendra, H., & Mohan, H. S. (2017b). A Review Of Synthetic Data Generation Methods For Privacy Preserving Data Publishing. International Journal of Scientific & Technology Research, 6(3), 95–101.

Tan, C., Behjati, R., & Arisholm, E. (2019). A model-based approach to generate dynamic synthetic test data: A conceptual model. In IEEE 12th International Conference on Software Testing, Verification and Validation Workshops, ICSTW 2019 (pp. 11–14). IEEE. https://doi.org/10.1109/ICSTW.2019.00026

Yale, A., Dash, S., Dutta, R., Guyon, I., Pavao, A., & Bennett, K. P. (2020a). Generation and evaluation of privacy preserving synthetic health data. Neurocomputing, 416, 244–255. https://doi.org/10.1016/j.neucom.2019.12.13 6

Yale, A., Dash, S., Dutta, R., Guyon, I., Pavao, A., & Bennett, K. P. (2020b). Generation and evaluation of privacy preserving synthetic health data. Neurocomputing, 416, 244–255. https://doi.org/10.1016/j.neucom.2019.12.13 6

Publicado

2023-10-19 — Actualizado el 2023-05-18

Versiones

Cómo citar

Ballesteros-Ricaurte, J. A., González- Sanabria, J. S., & Ordóñez, H. (2023). Generación de datos sinteticos para evaluar la enfermedad infecciosa leucosis bovina. REVISTA COLOMBIANA DE TECNOLOGIAS DE AVANZADA (RCTA), 1(41), 115–122. https://doi.org/10.24054/rcta.v1i41.2556 (Original work published 19 de octubre de 2023)

Número

Sección

Artículos