Determinación de factores de riesgo de bajo peso al nacer en Colombia aplicando análisis exploratorio de datos y modelos de machine learning para los años 2017 al 2021

dc.contributor.advisorAcevedo Pabón, Oscar Leonardo
dc.contributor.authorAguas Aldana, César Eduardo
dc.coverage.spatialBogotá D.C.
dc.coverage.temporal2017-2021
dc.date.accessioned2025-11-14T16:16:23Z
dc.date.available2025-11-14T16:16:23Z
dc.date.issued2025-10-27
dc.description.abstractEl trabajo busca identificar los principales factores asociados al bajo peso al nacer (BPN) en el país. Para ello utiliza técnicas de análisis exploratorio de datos y modelos de aprendizaje automático aplicados a la base de nacimientos del DANE entre 2017 y 2021. Dentro de las variables exógenas que podrían constituir un factor de riesgo que se incluyeron en los modelos hay características sociodemográficas de la madre como la edad, el número de partos, el nivel educativo y la región geográfica. Un análisis bivariado mostró que las madres adolescentes y de mayor edad, con bajo nivel educativo y residentes en áreas rurales tienen un mayor riesgo de tener bebés con BPN. Varios modelos de machine learning fueron evaluados, y el modelo con mejor desempeño fue una regresión logística mejorada con la técnica SMOTE (Synthetic Minority Over-sampling Technique). Para evaluar el rendimiento de los modelos, se aplicaron técnicas de validación cruzada y se utilizaron métricas como precisión, recall y F1-score. El estudio concluye que las intervenciones para mejorar el acceso a servicios de salud en áreas rurales y las políticas que abordan disparidades educativas y socioeconómicas pueden contribuir a reducir la incidencia de BPN en Colombia.spa
dc.description.abstractenglishThis project focuses on determining the risk factors associated with Low Birth Weight (LBW) in Colombia by applying exploratory data analysis and machine learning models. As a data source, we used a sample for the period 2017-2021 provided by the Colombian National Administrative Department of Statistics (DANE). This project focuses on determining the risk factors associated with LBW in Colombia by applying exploratory data analysis and machine learning models. As a data source, we used a sample for the period 2017-2021 provided by the Colombian National Administrative Department of Statistics (DANE). A bivariate analysis showed that adolescent and older mothers with low educational levels and living in rural areas have a higher risk of having LBW babies. Several machine learning models were evaluated, and the best-performing model was a logistic regression improved with the SMOTE technique (Synthetic Minority Over-sampling). To evaluate the performance of the models, cross-validation techniques were applied, and metrics such as precision, recall, and F1-score were used. Our study concludes that interventions to improve access to health services in rural areas and policies that address educational and socioeconomic disparities can contribute to lowering the incidence of LBW in Colombia.spa
dc.description.tableofcontents1. Objetivos... 5 2. Justificación... 5 3. Introducción... 6 4. Estado del arte... 7 5. Metodología...10 6. Resultados....13 6.1 Descripción de la muestra y de las variables...13 6.2 Análisis descriptivo... 14 6.3 Resultados de los modelos... 26 6.3.1 Comparación de matrices de confusión... 26 6.3.2 Comparación de las métricas de desempeño... 28 6.3.3 Discusión de relevancia de variables... 29 7. Conclusiones... 37 8. Bibliografía... 49spa
dc.format.mimetypeapplication/pdfspa
dc.identifier.instnameinstname:Politécnico Grancolombianospa
dc.identifier.reponamereponame:Alejandría Repositorio Comunidadspa
dc.identifier.repourlrepourl:http://alejandria.poligran.edu.cospa
dc.identifier.urihttp://hdl.handle.net/10823/7960
dc.language.isospaspa
dc.publisher.facultyFacultad Ingeniería y Diseño e Innovaciónspa
dc.publisher.programMatemáticasspa
dc.relationhttps://arxiv.org/abs/2310.07917spa
dc.relationhttps://doi.org/10.4103/tjem.tjem_182_23spa
dc.relationhttps://bibliotecadigital.udea.edu.co/bitstream/10495/16822/5/Qui%c3%b1onesMonica_spa
dc.relationhttps://repository.usta.edu.co/handle/11634/51826?show=fullspa
dc.relationhttp://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S1692715X2007000100008&lng=en&tlng=esspa
dc.relationhttps://doi.org/10.18597/rcog.3776spa
dc.relation.referencesOrganización Mundial de la Salud, Metas mundiales de nutrición 2025: Documento normativo sobre bajo peso al nacer, vol. 3. 2017, p. 8. doi: Licencia: CC BY-NC-SA 3.0 IGO. 5.spa
dc.relation.referencesShailaja, K., Seetharamulu, B., & Jabbar, M. A. (2018, March). Machine learning in healthcare: A review. In 2018 Second international conference on electronics, communication and aerospace technology (ICECA) (pp. 910-914). IEEE.spa
dc.relation.referencesFaruk, A., Cahyono, E. S., Eliyati, N., & Arifieni, I. (2018). Prediction and classification of low-birth-weight data using machine learning techniques. Indonesian Journal of Science and Technology, 3(1), 18-28.spa
dc.relation.referencesSalazar Blandon, D. A. (2023). Procesos gaussianos heterogéneos de múltiple salida para la predicción del bajo peso al nacer en Medellín.spa
dc.relation.referencesAhmadi, P., Alavimajd, H., Khodakarim, S., Tapak, L., Kariman, N., Amini, P., & Pazhuheian, F. (2017). Prediction of low birth weight using Random Forest: A comparison with Logistic Regression. Archives of Advances in Biosciences, 8(3), 36 43.spa
dc.relation.referencesDharmaraj, A., Ghimire, A. & Chinnaiyan, S. (2024). Factors Associated with Low Birth Weight: Analysis from National Family Health Survey-4, India. Indian J. Pediatr. 91, 421.spa
dc.relation.referencesJafarigol, E., & Trafalis, T. (2023). A review of machine learning techniques in Imbalanced Data and Future trends. arXiv preprint arXiv:2310.07917.spa
dc.relation.referencesScikit-learn developers. (2024). sklearn.linear_model.LogisticRegression. Scikit-learn.spa
dc.relation.referencesÇorbacıoğlu, Ş. K., & Aksel, G. (2023). Receiver operating characteristic curve analysis in diagnostic accuracy studies: A guide to interpreting the area under the curve value. Turkish journal of emergency medicine, 23(4), 195–198.spa
dc.relation.referencesTissera, A. P., & Couriel, N. I302-Aprendizaje Automático y Aprendizaje Profundo.spa
dc.relation.referencesvan Wieringen, W. N. (2015). Lecture notes on ridge regression. arXiv preprint arXiv:1509.09169.spa
dc.relation.referencesMonsreal, J. F., Cobos, M. D. R. T., Gómez, J. R. H., & Peraza, L. E. D. S. S. (2018). Factores de riesgo de bajo peso al nacer según el modelo de regresión logística múltiple. Estudio de cohorte retrospectiva en el municipio José María Morelos, Quintana Roo, México. Medwave, 18(1).spa
dc.relation.referencesPanduro, B. C. (2022). Aplicación del algoritmo del bosque aleatorio a un modelo de clasificación de la anemia en niños peruanos. Mediciego, 28(1), 3471.spa
dc.relation.referencesDepartamento Administrativo Nacional de Estadística – DANE. (2024). Microdatos de nacimientos 2017–2021. DANE.spa
dc.relation.referencesMárquez-Beltrán, M. F., Vargas-Hernández, J. E., Quiroga-Villalobos, E. F., & Pinzón Villate, G. Y. (2013). Análisis del bajo peso al nacer en Colombia 2005-2009. Revista de Salud Pública, 15, 626-637.spa
dc.relation.referencesYuan, Y., Du, J., Luo, J., Zhu, Y., Huang, Q., & Zhang, M. (2024). Discrimination of missing data types in metabolomics data based on particle swarm optimization algorithm and XGBoost model. Scientific Reports, 14(1), 152.spa
dc.relation.referencesPérez, S. A., Calderón, M. M., Vargas, M. P., Soto, I. G., Gómez, Á., & Quijano, D. D. (2017). Relación entre factores sociodemográficos y el bajo peso al nacer en una clínica universitaria en Cundinamarca (Colombia). Revista Salud Uninorte, 33(2), 86-97.spa
dc.relation.referencesPlanchez, L. C., Garcia, Y. E. N., de Pedro, N. M., & Sánchez, M. L. (2021). Índice pronóstico de bajo peso al nacer. Revista Médica Electrónica, 43(1).spa
dc.relation.referencesQuiñones Montes, M. M. (2020). Caracterización del bajo peso al nacer a término en Antioquia, Trabajo de Grado de Pregrado, Universidad de Antioquia.spa
dc.relation.referencesRivas Pérez, M. T. Factores Maternos Relacionados con Bajo Peso al Nacer en Colombia en el 2021. Trabajo de Grado de Maestría, Universidad Santo Tomás.spa
dc.relation.referencesTicona, J. P. A., Gutiérrez, M. B. A., Rivas, D. R. Z., & Torres, N. M. C. (2017). Entendiendo la odds ratio. Revista SCientifica, 15(1).spa
dc.relation.referencesBendezú, G., Espinoza, D., Bendezú-Quispe, G., Torres-Román, J. S., & Huamán Gutiérrez, R. M. (2016). Características y riesgos de gestantes adolescentes. Revista peruana de Ginecología y Obstetricia, 62(1), 13-18.spa
dc.relation.referencesPérez, B. H., Tejedor, J. G., Cepeda, P. M., & Gómez, A. A. (2011). La edad materna como factor de riesgo obstétrico. Resultados perinatales en gestantes de edad avanzada. Progresos de Obstetricia y ginecología, 54(11), 575-580.spa
dc.relation.referencesAguado Quintero, Luis Fernando, Girón Cruz, Luis Eduardo, Osorio Mejía, Ana María, Tovar Cuevas, Luis Miguel, & Ahumada Castro, Jaime Rodrigo. (2007). Determinantes del uso de los servicios de salud materna en el Litoral Pacífico Colombiano. Revista Latinoamericana de Ciencias Sociales, Niñez y Juventud, 5(1), 233-281.spa
dc.relation.referencesEstrada-Chiroque, L. M.., Orostegui-Arenas, M., Burgos-Guanilo , M. del P.., & Amau Chiroque, J. M. (2022). Características clínicas y resultado materno perinatal en mujeres con diagnóstico confirmado por COVID-19 en un hospital de Perú. Estudio de cohorte retrospectivo. Revista Colombiana De Obstetricia Y Ginecología, 73(1), 28–38.spa
dc.relation.referencesVelázquez Quintana, N. I., Masud Yunes Zárraga, J. L., & Ávila Reyes, R. (2004). Recién nacidos con bajo peso; causas, problemas y perspectivas a futuro. Boletín médico del Hospital Infantil de México, 61(1), 73-86.spa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombiaspa
dc.subject.keywordsExploratory data analysisspa
dc.subject.keywordsLow birth weightspa
dc.subject.keywordsMachine learningspa
dc.subject.lembAlgoritmosspa
dc.subject.lembDemografíaspa
dc.subject.lembModelos estadísticosspa
dc.subject.proposalAnálisis exploratorio de datosspa
dc.subject.proposalAprendizaje automáticospa
dc.subject.proposalBajo peso al nacerspa
dc.titleDeterminación de factores de riesgo de bajo peso al nacer en Colombia aplicando análisis exploratorio de datos y modelos de machine learning para los años 2017 al 2021spa
dc.title.translatedRisk factor determination of low birth weight in Colombia during 2017-2021 by exploratory data analysis and machine learning modelsspa
dc.typebachelorThesisspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1fspa
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
dc.type.driverinfo:eu-repo/semantics/bachelorThesisspa
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTesis/Trabajo de grado - Monografía - Pregradospa
dc.type.redcolhttps://purl.org/redcol/resource_type/TP
dc.type.versioninfo:eu-repo/semantics/acceptedVersionspa

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
trabajo_de_grado.pdf
Tamaño:
1.34 MB
Formato:
Adobe Portable Document Format
Descripción:
Documento principal

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descripción:

Colecciones