Minería de Datos: Una propuesta metodológica para educación superior
Resumen
El objetivo de este trabajo fue proponer una metodología de minería de datos en carreras de Ingeniería Civil en la Universidad de Tarapacá, sede de Iquique. Para lo cual se utilizó CRISP-DM. Con esto, es posible aplicar las diferentes etapas de la metodología a datos reales, dependiendo del problema a resolver, generando nuevo conocimiento y utilizando la herramienta Rapidminer, con diferentes mediciones y algoritmos. Luego, se concluye que esta metodología puede generar nuevos conocimientos basados en pasos establecidos, teniendo la posibilidad de aplicar prácticas innovadoras en la gestión de datos.
Abstract
The objective of this work was to propose a methodology of data mining in civil engineering careers at the University of Tarapacá, Iquique headquarters. For which CRISP-DM was used. With this, it is possible to apply the different stages of the methodology to real data, depending on the problem to be solved, generating new knowledge and using the Rapidminer tool, with different measurements and algorithms. Then, it is concluded that this methodology can generate new knowledge based on established steps, having the possibility of applying innovative practices in data management.
Citas
Azevedo, A., & Santos, M. 2008. KDD, SEMMA and CRISP-DM: a parallel overview. IADIS European Conference Data Mining, 182-185. Disponible en: http://recipp.ipp.pt/handle/10400.22/136. Consultado el: 26/01/2018.
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. 2000. CRISP-DM 1.0 Step-by-step data mining guide. The CRISP-DM consortium.
Consejo Nacional de Educación. 2006. Consejo Nacional de Educación. Disponible en: https://www.cned.cl/file/1866/download?token=I9R8EP2L. Consultado el: 05/03/2018.
Dirección de Calidad Institucional. 2018. Universidad de Tarapacá.
Disponible en:
https://www.uta.cl/web/site/artic/20180629/asocfile/20180629155 848/anuar2017.pdf. Consultado el: 17/03/2018.
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. 1996. "From data mining to knowledge discovery in databases". AI Magazine, 17(3), 37-53. doi:https://doi.org/10.1609/aimag.v17i3.1230.
Galán Cortina, V. 2015. Aplicación de la Metodología CRISP-DM a un Proyecto de Minería de Datos en el Entorno Universitario (Tesis de Pregrado). Universidad Carlos III. Madrid.
Goicoechea, A. 2002. Imputación basada en árboles de clasificación.
Disponible en: http://www.eustat.eus/document/datos/ct_04_c.pdf. Consultado el: 28/09/2018.
Hernández Orallo, J., Ramírez Quintana, M., & Ferri Ramírez, C. 2004. Introducción a la Minería de Datos. Madrid: Pearson Educación .
Himmel K., E. 2002. "Modelos de análisis de la deserción estudiantil en la educación superior - Retención y movilidad estudiantil". Revista Calidad En La Educación, 91-108. Disponible en: http://www.alfaguia.org/alfaguia/files/1318955602Modelo de analisis de la desercion estudiantil en la educacion superior.pdf. Consultado el: 17/04/2018.
Jiawei, H., Micheline, K., & Jian, P. 2012. Data Mining: Concepts and Techniques. Waltham, MA: Morgan Kaufmann.
Kotu, V., & Deshpande, B. 2015. Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner. Waltham,
MA: Morgan Kaufmann. doi:https://doi.org/10.1016/C2014-000329-2
Lohr, S. 1999. Sampling: Design and Analysis. New York: Cengage Learning.
Marcano Aular, Y. J., & Talavera Pereira, R. 2007. "Minería de Datos como soporte a la toma de decisiones empresariales". Opción, 23(52), 104-118.
North, M. 2016. Data Mining for the masses, second edition, with implementations in Rapidminer and R. Middletown:
CreateSpace Independent Publishing Platform.
Piatetsky, B. 2014. CRISP-DM, still the top methodology for analytics, data mining, or data science projects. Disponible en: https://www.kdnuggets.com/2014/10/crisp-dm-top-methodologyanalytics-data-mining-data-science-projects.html. Consultado el :15/08/2018.
Rapidminer. 2018. Lightning Fast Data Science for Teams. Disponible en: https://rapidminer.com/. Consultado el: 18/03/2018.
Rodríguez, V., González Campos, J., & Patricio Aguilera, J. 2017.
Modelo Predictivo para la Permanencia en la Educación Superior. Disponible en: http://revistas.utp.ac.pa/index.php/clabes/article/view/1588. Consultado el: 20/05/2018.
Rosado, A., & Verjel, A. 2017. "APLICACIÓN DE LA MINERIA DE DATOS EN LA EDUCACION EN LINEA". Revista Colombiana de Tecnologías de Avanzada, 1(29). doi:https://doi.org/10.24054/16927257.v29.n29.2017.2491.
Universidad de Tarapacá. 2012. Modelo Educativo. Disponible en: https://www.uta.cl/adjunto/mei.pdf. Consultado el: 21/03/2018.
Useche, L., & Mesa, D. 2006. "Una introducción a la imputación de valores perdidos". Terra, XXII(31), 127-152.
Yang, Z., Zhang, T., Lu, J., Zhang, D., & Kalui, D. 2017. "Optimizing area under the ROC curve via extreme learning machines". Knowledge-Based Systems, 130, 74–89. doi:https://doi.org/10.1016/j.knosys.2017.05.013.
Zhang, S. 2012. "Nearest neighbor selection for iteratively kNN imputation". Journal of Systems and Software, 85(11), 2541– 2552. doi:https://doi.org/10.1016/j.jss.2012.05.073.