Modelo de ensamble para predecir el diagnóstico de pacientes con sospecha de Covid-19

Palabras clave: Modelo de ensamble, aprendizaje automático, riesgo clínico, clasificación, Covid-19

Resumen

La pandemia de Covid-19 ha afectado a millones de personas en todo el mundo, siendo calificada por la Organización Mundial de la Salud como una crisis de preocupación global. Esto ha generado la necesidad de realizar una predicción oportuna del diagnóstico de pacientes con alto riesgo de deterioro clínico en establecimientos médicos. El objetivo de este estudio es diseñar y comparar el rendimiento de modelos de aprendizaje automático basados en ensambles de máquinas para predecir pacientes con sospecha de Covid-19. La investigación sigue el paradigma positivista, enfoque cuantitativo, diseño observacional sin intervención, nivel predictivo. Para llevar a cabo este estudio, se recopilaron 1.000 registros de pacientes de dos establecimientos de salud en Perú. La construcción de los modelos se basó en algoritmos de ensamble, como Random Forest, Extra Trees, Gradient Boosting y AdaBoosting. Al comparar los modelos en términos de exactitud (accuracy), que mide el porcentaje de casos clasificados correctamente como pacientes con sospecha de Covid-19, se obtuvo un 97% de precisión para los modelos basados en Random Forest y Gradient Boosting. Además, el valor de Kappa de Cohen fue de 0.95, lo cual indica una concordancia muy buena entre el resultado de predicción del modelo y los datos reales.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Daniel Andrade-Girón

Doctor en Ingeniería. Magíster en Matemática. Docente Universitario en la Universidad Nacional José Faustino Sánchez Carrión, Huacho, Perú. E-mail: dandrade@unjfsc.edu.pe ORCID: https://orcid.org/0000-0002-9746-3583

Juana Sandivar-Rosas

Doctora en Ingeniería. Magíster en Ingeniería de Sistemas. Docente Universitario en la Universidad Nacional Mayor de San Marcos, Lima, Perú. E-mail: jsandivarr@unmsm.edu.pe ORCID: https://orcid.org/0000-0001-8494-2940

Edgardo Carreño-Cisneros

Doctor en Educación. Magister en Ingeniería de Sistemas. Docente Universitario en la Universidad Nacional José Faustino Sánchez Carrión, Huacho, Perú. E-mail: ecarreno@unjfsc.edu.pe ORCID: https://orcid.org/0000-0001-7063-7072

Citas

Abdul, N. H., Wan, W. F., Wah, Y. B., Azlin, S., Shaadam, N., y Indratno, S. W. (2023). Comparison of ensemble hybrid sampling with bagging and boosting machine learning approach for imbalanced data. Indonesian Journal of Electrical Engineering and Computer Science, 29(1), 598-608. http://doi.org/10.11591/ijeecs.v29.i1.pp598-608

Ahamad, M. M., Aktar, S., Rashed-Al-Mahfuz, M., Uddin, S., Liò, P., Xu, H., Summers, M. A., Quinn, J. M. W., y Moni, M. A. (2020). A machine learning model to identify early stage symptoms of SARS-Cov-2 infected patients. Expert Systems with Applications, 160, 113661. https://doi.org/10.1016/j.eswa.2020.113661

Chen, Y., Liu, Q., y Guo, D. (2020). Emerging coronaviruses: genome structure, replication, and pathogenesis. Journal of Medical Virology, 92(4), 418-423. https://doi.org/10.1002/jmv.25681

Comito, C., y Pizzuti, C. (2022). Artificial intelligence for forecasting and diagnosing COVID-19 pandemic: A focused review. Artificial Intelligence in Medicine, 128, 102286. https://doi.org/10.1016/j.artmed.2022.102286

Corso, C. L., Maldonado, C., Martínez, G., Casatti, M., y Mallo, A. (2018). Modelo de ensamble homogéneo basado en un proceso de reducción de datos simultaneo dirigido a la resolución de problemas de clasificación supervisada. Revista de la Facultad de Ciencias Exactas, Físicas y Naturales, 5(S-2), 51-55. https://revistas.unc.edu.ar/index.php/FCEFyN/article/view/22897

De León, J., Pareja, A., Aguilar, P., Enriquez, Y., Quiroz, C., y Valencia, E. (2020). SARS-CoV-2 y sistema inmune: Una batalla de titanes. Horizonte Médico, 20(2), e1209. https://doi.org/10.24265/horizmed.2020.v20n2.12

Dilmi, S. (2022). Automatic COVID-19 diagnosis using deep learning features and support vector machines based on Bayesian optimization. ICAASE 2022 - 5th Edition of the International Conference on Advanced Aspects of Software Engineering, Proceedings, Constantine, Algeria, 1-8. https://doi.org/10.1109/ICAASE56196.2022.9931584

Dunlop, C., Howe, A., Li, D., y Allen, L. N. (2020). The coronavirus outbreak: The central role of primary care in emergency preparedness and response. BJGP Open, 4(1). https://doi.org/10.3399/bjgpopen20X101041

Elguea, P. A., Prado, O. A., y Barradas, J. (2019). Implementación de una escala de gravedad para la activación del equipo de respuesta rápida: NEWS 2. Medicina Critica, 33(2), 98-103. https://www.medigraphic.com/cgi-bin/new/resumen.cgi?IDARTICULO=87296

Fuentes, M. D., y Medina, W. D. (2021). Diseño de un modelo predictivo-asistencial de pacientes infectados por Covid-19, mediante un modelo supervisado de Machine Learning basado en criterios de derivación hospitalaria o ambulatoria [Tesis de pregrado, Universidad de Guayaquil]. http://repositorio.ug.edu.ec/handle/redug/52650

García, L. F. (2020). Immune response, inflammation, and the clinical spectrum of COVID-19. Frontiers in Immunology, 11, 1441. https://doi.org/10.3389/fimmu.2020.01441

Gerón, A. (2022). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. O'Reilly Media, Inc.

Gómez-Gómez, A., Gómez-Escanamé M. J., Sánchez-Ramos L., y Noyola, D. E. (2020). Diagnóstico y tratamiento temprano de neumonía ante la pandemia por COVID-19 en San Luis Potosí. ¿Es posible implementar una estrategia para lograrlo? NCT Neumología y Cirugía de Tórax, 79(4), 214-220. https://doi.org/10.35366/97962

Guan, W.-J., Ni, Z.-Y., Hu, Y., Lian, W.-H., Ou, C.-Q., He, J.-X., Liu, L., Shan, H., Lei, C.-L., Hui, D. S. C., Du, B., Li, L.-J., Zeng, Guang., Yuen, K.-Yung., Chen, R.-C., Tang, C.-L., Wang, T., Chen, P.Y., Xiang, J.,…Zhong, N.-S. (2020). Clinical characteristics of coronavirus disease 2019 in China. New England Journal of Medicine, 382(18), 1708-1720. https://doi.org/10.1056/NEJMoa2002032

Jiang, F., Deng, L., Zhang, L., Cai, Y., Cheung, C. W., y Xia, Z. (2019). Review of the clinical characteristics of coronavirus disease 2019 (COVID-19). Journal of General Internal Medicine, 35, 1545-1549. https://doi.org/10.1007/s11606-020-05762-w

Kesav, N., y Jubukumar, M. G. (2022). A deep learning approach with Bayesian optimized Kernel support vector machine for Covid-19 diagnosis. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, 11(3), 623-637. https://doi.org/10.1080/21681163.2022.2099299

Khoshgoftaar, T. M., Van, H., y Napolitano, A. (2011). Comparing boosting and bagging techniques with noisy and imbalanced data. IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans, 3, 552-568. https://doi.org/10.1109/TSMCA.2010.2084081

Lora, M., Barrantes, S. A. M., Peñalver, M., y Rodríguez, J. L. (2023). Apoyo familiar y calidad de vida percibida por pacientes con diabetes mellitus-2 en tiempos Covid-19. Revista de Ciencias Sociales (Ve), XXIX(1), 357-368. https://doi.org/10.31876/rcs.v29i1.39756

Luna, B. D., y Carranza, L. E. (2023). Reconocimiento de la presencia de sars-cov-2 en pulmones a través de imágenes de radiodiagnóstico haciendo uso de Machine Learning con Python. LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, 4(1), 788-806. https://doi.org/10.56712/latam.v4i1.296

Luna-Nemecio, J. (2020). Determinaciones socioambientales del COVID-19 y vulnerabilidad económica, espacial y sanitario-institucional. Revista de Ciencias Sociales (Ve), XXVI(2), 21-26. https://doi.org/10.31876/rcs.v26i2.32419

Manosalvas, M. G., y Zamora, S. C. (2021). Validación de la escala News 2 para predecir deterioro clínico en pacientes adultos mayores hospitalizados con neumonía por SARS CoV-2/COVID-19, Hospital de Especialidades Eugenio Espejo, marzo 2020 a marzo 2021 [Tesis de especialista, Pontificia Universidad Católica del Ecuador]. http://repositorio.puce.edu.ec:80/handle/22000/20775

Marruecos, M. E. (2020). Incidencia del Covid-19 en el derecho humano fundamental a la libertad ambulatoria. Revista de Ciencias Sociales (Ve), XXVI(2), 13-15. https://doi.org/10.31876/rcs.v26i2.32418

Martínez, J. R., y Del Pino, R. (2020). Manual práctico de enfermería comunitaria. Elsevier.

Mojica-Crespo, R., y Morales-Crespo, M. M. (2020). Pandemia COVID-19, la nueva emergencia sanitaria de preocupación internacional: Una revisión. Medicina de Familia. SEMERGEN, 46(S-1), 65-77. https://doi.org/10.1016/j.semerg.2020.05.010

Moulaei, K., Shanbehzadeh, M., Mohammadi-Taghiabad, Z., y Kazemi-Arpanahi, H. (2022). Comparing machine learning algorithms for predicting COVID-19 mortality. BMC Medical Informatics and Decision Making, 22(1), 2. https://doi.org/10.1186/s12911-021-01742-0

Pajankar, A., y Joshi, A. (2022). Hands-on machine learning with Python: Implement neural network solutions with Scikit-learn and PyTorch. Apress.

Patiño, D., Munive, C., Cevallos-Torres, L., y Botto-Tobar, M. (2021). Predicting the effectiveness of rapid tests performed to patients with COVID-19 through Linear Regression and Random Forest. Ecuadorian Science Journal, 5(2), 31-43. https://doi.org/10.46480/esj.5.2.108

Preciado, A. J., Valles, M. A., y Lévano, D. (2021). Importancia del uso de sistemas de información en la automatización de historiales clínicos, una revisión sistemática. Revista Cubana de Informática Médica, 13(1), e417. https://www.medigraphic.com/cgi-bin/new/resumen.cgi?IDARTICULO=105413

Pu, L., y Shamir, R. (2023). 4CAC: 4-class classification of metagenome assemblies using machine learning and assembly graphs. bioRxiv, 2023-01. https://doi.org/10.1101/2023.01.20.524935

Romero-Hernández, S., Zamarrón, E. I., Saavedra, J., Pérez, O. R., Guerrero, M. A., Soriano, R., Sánchez-Díaz, S., y Deloya, E. (2020). Protocolo de atención para COVID-19 (SARS-CoV-2) de la Sociedad Mexicana de Medicina de Emergencias. Sociedad Mexicana de Medicina de Emergencias.

Rückert, P., Papenberg, B., y Tracht, K. (2021). Classification of assembly operations using machine learning algorithms based on visual sensor data. Procedia CIRP, 97, 110-116. https://doi.org/10.1016/j.procir.2020.05.211

Sánchez-Duque, J. A., Arce-Villalobos, L. R., y Rodríguez-Morales, A. J. (2020). Enfermedad por coronavirus 2019 (COVID-19) en América Latina: papel de la atención primaria en la preparación y respuesta. Atención Primaria, 52(6), 369-372. https://doi.org/10.1016/j.aprim.2020.04.001

Sreepadmanabh, M., Sahu, A. K., y Chande, A. (2020). COVID-19: Advances in diagnostic tools, treatment strategies, and vaccine development. Journal of Biosciences, 45(1), 148. https://doi.org/10.1007/s12038-020-00114-6

Tillaguango, J. R. (2021). Revisión sistemática de literatura: Análisis de viabilidad para la detección y diagnóstico de Covid-19, aplicando modelos de Inteligencia Artificial (IA). CEDAMAZ., 11(2), 142-151. https://doi.org/10.54753/cedamaz.v11i2.1183

Tran, V.-L., y Kim, J.-K. (2023). Ensemble machine learning-based models for estimating the transfer length of strands in PSC beams. Expert Systems with Applications, 221, 119768. https://doi.org/10.1016/j.eswa.2023.119768

Vaishya, R., Javaid, M., Haleem, I., y Haleem, A. (2020). Artificial Intelligence (AI) applications for COVID-19 pandemic. Diabetes & Metabolic Syndrome: Clinical Research & Review, 14(4), 337-339. https://doi.org/10.1016/j.dsx.2020.04.012

Xiao, T., Zhu, J., y Liu, T. (2013). Bagging and Boosting statistical machine translation systems. Artificial Intelligence, 195, 496-527. https://doi.org/10.1016/j.artint.2012.11.005

Xiong, Y., Ma, Y., Ruan, L., Li, D., Lu, C., y Huang, L. (2022). Comparing different machine learning techniques for predicting COVID-19 severity. Infectious Diseases of Poverty, 11, 19. https://doi.org/10.1186/s40249-022-00946-4

Xue, Y. (2019). An overview of overfitting and its solutions. Journal of Physics: Conference Series, 1168(2), 022022. https://doi.org/10.1088/1742-6596/1168/2/022022

Yaman, E., y Subasi, A. (2019). Comparison of bagging and boosting ensemble machine learning methods for automated EMG signal classification. BioMed Research International, 2019, 9152506. https://doi.org/10.1155/2019/9152506

Yaman, M. A., Rattay, F., y Subasi, A. (2021). Comparison of bagging and boosting ensemble machine learning methods for face recognition. Procedia Computer Science, 194, 202-209. https://doi.org/10.1016/j.procs.2021.10.074

Zachary, C., y Papailiopoulos, D. (2018). Stability and generalization of learning algorithms that converge to global optima. Proceedings of the 35th International Conference on Machine Learning, PMLR, 80, 745-754. https://proceedings.mlr.press/v80/charles18a.html

Zoabi, Y., Deri-Rozov, S., y Shomron, N. (2021). Machine learning-based prediction of COVID-19 diagnosis based on symptoms. Digital Medicine, 4, 3. https://doi.org/10.1038/s41746-020-00372-6
Publicado
2023-10-03
Cómo citar
Andrade-Girón, D., Sandivar-Rosas, J., & Carreño-Cisneros, E. (2023). Modelo de ensamble para predecir el diagnóstico de pacientes con sospecha de Covid-19. Revista De Ciencias Sociales, 29, 526-538. https://doi.org/10.31876/rcs.v29i.40973