Modelo de ensamble para predecir el diagnóstico de pacientes con sospecha de Covid-19
Resumen
La pandemia de Covid-19 ha afectado a millones de personas en todo el mundo, siendo calificada por la Organización Mundial de la Salud como una crisis de preocupación global. Esto ha generado la necesidad de realizar una predicción oportuna del diagnóstico de pacientes con alto riesgo de deterioro clínico en establecimientos médicos. El objetivo de este estudio es diseñar y comparar el rendimiento de modelos de aprendizaje automático basados en ensambles de máquinas para predecir pacientes con sospecha de Covid-19. La investigación sigue el paradigma positivista, enfoque cuantitativo, diseño observacional sin intervención, nivel predictivo. Para llevar a cabo este estudio, se recopilaron 1.000 registros de pacientes de dos establecimientos de salud en Perú. La construcción de los modelos se basó en algoritmos de ensamble, como Random Forest, Extra Trees, Gradient Boosting y AdaBoosting. Al comparar los modelos en términos de exactitud (accuracy), que mide el porcentaje de casos clasificados correctamente como pacientes con sospecha de Covid-19, se obtuvo un 97% de precisión para los modelos basados en Random Forest y Gradient Boosting. Además, el valor de Kappa de Cohen fue de 0.95, lo cual indica una concordancia muy buena entre el resultado de predicción del modelo y los datos reales.
Descargas
Citas
Ahamad, M. M., Aktar, S., Rashed-Al-Mahfuz, M., Uddin, S., Liò, P., Xu, H., Summers, M. A., Quinn, J. M. W., y Moni, M. A. (2020). A machine learning model to identify early stage symptoms of SARS-Cov-2 infected patients. Expert Systems with Applications, 160, 113661. https://doi.org/10.1016/j.eswa.2020.113661
Chen, Y., Liu, Q., y Guo, D. (2020). Emerging coronaviruses: genome structure, replication, and pathogenesis. Journal of Medical Virology, 92(4), 418-423. https://doi.org/10.1002/jmv.25681
Comito, C., y Pizzuti, C. (2022). Artificial intelligence for forecasting and diagnosing COVID-19 pandemic: A focused review. Artificial Intelligence in Medicine, 128, 102286. https://doi.org/10.1016/j.artmed.2022.102286
Corso, C. L., Maldonado, C., Martínez, G., Casatti, M., y Mallo, A. (2018). Modelo de ensamble homogéneo basado en un proceso de reducción de datos simultaneo dirigido a la resolución de problemas de clasificación supervisada. Revista de la Facultad de Ciencias Exactas, Físicas y Naturales, 5(S-2), 51-55. https://revistas.unc.edu.ar/index.php/FCEFyN/article/view/22897
De León, J., Pareja, A., Aguilar, P., Enriquez, Y., Quiroz, C., y Valencia, E. (2020). SARS-CoV-2 y sistema inmune: Una batalla de titanes. Horizonte Médico, 20(2), e1209. https://doi.org/10.24265/horizmed.2020.v20n2.12
Dilmi, S. (2022). Automatic COVID-19 diagnosis using deep learning features and support vector machines based on Bayesian optimization. ICAASE 2022 - 5th Edition of the International Conference on Advanced Aspects of Software Engineering, Proceedings, Constantine, Algeria, 1-8. https://doi.org/10.1109/ICAASE56196.2022.9931584
Dunlop, C., Howe, A., Li, D., y Allen, L. N. (2020). The coronavirus outbreak: The central role of primary care in emergency preparedness and response. BJGP Open, 4(1). https://doi.org/10.3399/bjgpopen20X101041
Elguea, P. A., Prado, O. A., y Barradas, J. (2019). Implementación de una escala de gravedad para la activación del equipo de respuesta rápida: NEWS 2. Medicina Critica, 33(2), 98-103. https://www.medigraphic.com/cgi-bin/new/resumen.cgi?IDARTICULO=87296
Fuentes, M. D., y Medina, W. D. (2021). Diseño de un modelo predictivo-asistencial de pacientes infectados por Covid-19, mediante un modelo supervisado de Machine Learning basado en criterios de derivación hospitalaria o ambulatoria [Tesis de pregrado, Universidad de Guayaquil]. http://repositorio.ug.edu.ec/handle/redug/52650
García, L. F. (2020). Immune response, inflammation, and the clinical spectrum of COVID-19. Frontiers in Immunology, 11, 1441. https://doi.org/10.3389/fimmu.2020.01441
Gerón, A. (2022). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. O'Reilly Media, Inc.
Gómez-Gómez, A., Gómez-Escanamé M. J., Sánchez-Ramos L., y Noyola, D. E. (2020). Diagnóstico y tratamiento temprano de neumonía ante la pandemia por COVID-19 en San Luis Potosí. ¿Es posible implementar una estrategia para lograrlo? NCT Neumología y Cirugía de Tórax, 79(4), 214-220. https://doi.org/10.35366/97962
Guan, W.-J., Ni, Z.-Y., Hu, Y., Lian, W.-H., Ou, C.-Q., He, J.-X., Liu, L., Shan, H., Lei, C.-L., Hui, D. S. C., Du, B., Li, L.-J., Zeng, Guang., Yuen, K.-Yung., Chen, R.-C., Tang, C.-L., Wang, T., Chen, P.Y., Xiang, J.,…Zhong, N.-S. (2020). Clinical characteristics of coronavirus disease 2019 in China. New England Journal of Medicine, 382(18), 1708-1720. https://doi.org/10.1056/NEJMoa2002032
Jiang, F., Deng, L., Zhang, L., Cai, Y., Cheung, C. W., y Xia, Z. (2019). Review of the clinical characteristics of coronavirus disease 2019 (COVID-19). Journal of General Internal Medicine, 35, 1545-1549. https://doi.org/10.1007/s11606-020-05762-w
Kesav, N., y Jubukumar, M. G. (2022). A deep learning approach with Bayesian optimized Kernel support vector machine for Covid-19 diagnosis. Computer Methods in Biomechanics and Biomedical Engineering: Imaging & Visualization, 11(3), 623-637. https://doi.org/10.1080/21681163.2022.2099299
Khoshgoftaar, T. M., Van, H., y Napolitano, A. (2011). Comparing boosting and bagging techniques with noisy and imbalanced data. IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans, 3, 552-568. https://doi.org/10.1109/TSMCA.2010.2084081
Lora, M., Barrantes, S. A. M., Peñalver, M., y Rodríguez, J. L. (2023). Apoyo familiar y calidad de vida percibida por pacientes con diabetes mellitus-2 en tiempos Covid-19. Revista de Ciencias Sociales (Ve), XXIX(1), 357-368. https://doi.org/10.31876/rcs.v29i1.39756
Luna, B. D., y Carranza, L. E. (2023). Reconocimiento de la presencia de sars-cov-2 en pulmones a través de imágenes de radiodiagnóstico haciendo uso de Machine Learning con Python. LATAM Revista Latinoamericana de Ciencias Sociales y Humanidades, 4(1), 788-806. https://doi.org/10.56712/latam.v4i1.296
Luna-Nemecio, J. (2020). Determinaciones socioambientales del COVID-19 y vulnerabilidad económica, espacial y sanitario-institucional. Revista de Ciencias Sociales (Ve), XXVI(2), 21-26. https://doi.org/10.31876/rcs.v26i2.32419
Manosalvas, M. G., y Zamora, S. C. (2021). Validación de la escala News 2 para predecir deterioro clínico en pacientes adultos mayores hospitalizados con neumonía por SARS CoV-2/COVID-19, Hospital de Especialidades Eugenio Espejo, marzo 2020 a marzo 2021 [Tesis de especialista, Pontificia Universidad Católica del Ecuador]. http://repositorio.puce.edu.ec:80/handle/22000/20775
Marruecos, M. E. (2020). Incidencia del Covid-19 en el derecho humano fundamental a la libertad ambulatoria. Revista de Ciencias Sociales (Ve), XXVI(2), 13-15. https://doi.org/10.31876/rcs.v26i2.32418
Martínez, J. R., y Del Pino, R. (2020). Manual práctico de enfermería comunitaria. Elsevier.
Mojica-Crespo, R., y Morales-Crespo, M. M. (2020). Pandemia COVID-19, la nueva emergencia sanitaria de preocupación internacional: Una revisión. Medicina de Familia. SEMERGEN, 46(S-1), 65-77. https://doi.org/10.1016/j.semerg.2020.05.010
Moulaei, K., Shanbehzadeh, M., Mohammadi-Taghiabad, Z., y Kazemi-Arpanahi, H. (2022). Comparing machine learning algorithms for predicting COVID-19 mortality. BMC Medical Informatics and Decision Making, 22(1), 2. https://doi.org/10.1186/s12911-021-01742-0
Pajankar, A., y Joshi, A. (2022). Hands-on machine learning with Python: Implement neural network solutions with Scikit-learn and PyTorch. Apress.
Patiño, D., Munive, C., Cevallos-Torres, L., y Botto-Tobar, M. (2021). Predicting the effectiveness of rapid tests performed to patients with COVID-19 through Linear Regression and Random Forest. Ecuadorian Science Journal, 5(2), 31-43. https://doi.org/10.46480/esj.5.2.108
Preciado, A. J., Valles, M. A., y Lévano, D. (2021). Importancia del uso de sistemas de información en la automatización de historiales clínicos, una revisión sistemática. Revista Cubana de Informática Médica, 13(1), e417. https://www.medigraphic.com/cgi-bin/new/resumen.cgi?IDARTICULO=105413
Pu, L., y Shamir, R. (2023). 4CAC: 4-class classification of metagenome assemblies using machine learning and assembly graphs. bioRxiv, 2023-01. https://doi.org/10.1101/2023.01.20.524935
Romero-Hernández, S., Zamarrón, E. I., Saavedra, J., Pérez, O. R., Guerrero, M. A., Soriano, R., Sánchez-Díaz, S., y Deloya, E. (2020). Protocolo de atención para COVID-19 (SARS-CoV-2) de la Sociedad Mexicana de Medicina de Emergencias. Sociedad Mexicana de Medicina de Emergencias.
Rückert, P., Papenberg, B., y Tracht, K. (2021). Classification of assembly operations using machine learning algorithms based on visual sensor data. Procedia CIRP, 97, 110-116. https://doi.org/10.1016/j.procir.2020.05.211
Sánchez-Duque, J. A., Arce-Villalobos, L. R., y Rodríguez-Morales, A. J. (2020). Enfermedad por coronavirus 2019 (COVID-19) en América Latina: papel de la atención primaria en la preparación y respuesta. Atención Primaria, 52(6), 369-372. https://doi.org/10.1016/j.aprim.2020.04.001
Sreepadmanabh, M., Sahu, A. K., y Chande, A. (2020). COVID-19: Advances in diagnostic tools, treatment strategies, and vaccine development. Journal of Biosciences, 45(1), 148. https://doi.org/10.1007/s12038-020-00114-6
Tillaguango, J. R. (2021). Revisión sistemática de literatura: Análisis de viabilidad para la detección y diagnóstico de Covid-19, aplicando modelos de Inteligencia Artificial (IA). CEDAMAZ., 11(2), 142-151. https://doi.org/10.54753/cedamaz.v11i2.1183
Tran, V.-L., y Kim, J.-K. (2023). Ensemble machine learning-based models for estimating the transfer length of strands in PSC beams. Expert Systems with Applications, 221, 119768. https://doi.org/10.1016/j.eswa.2023.119768
Vaishya, R., Javaid, M., Haleem, I., y Haleem, A. (2020). Artificial Intelligence (AI) applications for COVID-19 pandemic. Diabetes & Metabolic Syndrome: Clinical Research & Review, 14(4), 337-339. https://doi.org/10.1016/j.dsx.2020.04.012
Xiao, T., Zhu, J., y Liu, T. (2013). Bagging and Boosting statistical machine translation systems. Artificial Intelligence, 195, 496-527. https://doi.org/10.1016/j.artint.2012.11.005
Xiong, Y., Ma, Y., Ruan, L., Li, D., Lu, C., y Huang, L. (2022). Comparing different machine learning techniques for predicting COVID-19 severity. Infectious Diseases of Poverty, 11, 19. https://doi.org/10.1186/s40249-022-00946-4
Xue, Y. (2019). An overview of overfitting and its solutions. Journal of Physics: Conference Series, 1168(2), 022022. https://doi.org/10.1088/1742-6596/1168/2/022022
Yaman, E., y Subasi, A. (2019). Comparison of bagging and boosting ensemble machine learning methods for automated EMG signal classification. BioMed Research International, 2019, 9152506. https://doi.org/10.1155/2019/9152506
Yaman, M. A., Rattay, F., y Subasi, A. (2021). Comparison of bagging and boosting ensemble machine learning methods for face recognition. Procedia Computer Science, 194, 202-209. https://doi.org/10.1016/j.procs.2021.10.074
Zachary, C., y Papailiopoulos, D. (2018). Stability and generalization of learning algorithms that converge to global optima. Proceedings of the 35th International Conference on Machine Learning, PMLR, 80, 745-754. https://proceedings.mlr.press/v80/charles18a.html
Zoabi, Y., Deri-Rozov, S., y Shomron, N. (2021). Machine learning-based prediction of COVID-19 diagnosis based on symptoms. Digital Medicine, 4, 3. https://doi.org/10.1038/s41746-020-00372-6
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial-CompartirIgual 4.0.