La separación en regresión logística, una solución y aplicación
DOI:
https://doi.org/10.17533/udea.rfnsp.8770Palabras clave:
modelo logístico, estimación de máxima verosimilitud, menarquiaResumen
La regresión logística es una de las técnicas estadísticas más aplicadas cuando se busca explicar el comportamiento probabilístico de algún fenómeno. Un problema que aparece con frecuencia en estos modelos es la separación en los datos, mostrando los grupos de éxitos separados de los fracasos, lo que impide hallar los estimadores de máxima verosimilitud. Objetivo: Presentar una revisión y solución del problema, comparando con otras existentes. Metodología: Simulación del modelo logístico y estimación del sesgo de los parámetros, usando la solución propuesta con el método clásico. Bayesiano y observaciones ficticias y con el método de Firth. Resultados: Los sesgos encontrados son menores al generar el par de observaciones ficticias con el método Bayesiano. Se muestra un ejemplo sobre la edad de la menarquia. Discusión: Se aporta una solución adecuada al problema de la separación usando simulación en un esquema de modelo logístico sencillo. Conclusiones: la generación de observaciones ficticias se recomienda dentro de la región de separación y el mejor método de solución está basado en la teoría bayesiana, donde se logra una convergencia en los parámetros del modelo logístico.
Descargas
Citas
(1). Albert A, Anderson JA. On the existence of maximum likeliho-od estimates in logistic regression models. Biometrika 1984;71: 1-10. DOI: https://doi.org/10.1093/biomet/71.1.1
(2). Christmann A, Rousseeuw PJ. Measuring overlap in binary regression. Computational Statistics and Data Analysis 2001; 37: 65-75. DOI: https://doi.org/10.1016/S0167-9473(00)00063-3
(3). Christmann A, Rousseeuw PJ. Robustness against separation and outliers in logistic regression, Computational Statistics and Data Analysis 2003;43: 315-332. DOI: https://doi.org/10.1016/S0167-9473(02)00304-3
(4). King E, Ryan TP. A preliminary investigation of maximum likeli-hood logistic regression versus Exact logisic Regression. Ameri-can Statistical Association 2002; 56 (3): 163-170. DOI: https://doi.org/10.1198/00031300283
(5). Lesaffre E, Albert A. Partial Separation in Logistic Discrimination. Journal of the Royal Statistical Society. Series B (Methodo-logical) 1989; 51(1): 109-116. DOI: https://doi.org/10.1111/j.2517-6161.1989.tb01752.x
(6). Rindskopf D. Infinite parameter estimates in logistic regression: Opportunities, not problems. Journal of Educational and Behavioral Statistics 2002; 27(2): 147-161. DOI: https://doi.org/10.3102/10769986027002147
(7). Gentleman R, Ihaka R. R: A Language and Environment for Statistical Computing. R Development Core Team [internet] R Foundation for Statistical Computing: Vienna; 2009 [acceso 07 de noviembre de 2010]. Disponible en: www.R-project.org..
(8). Santner TJ, Duffy DE. A note on A. Albert and J. A. Anderson’s conditions for the existence of maximum likelihood estimates in logistic regression models. Biometrika 1986; 73(3): 755-758. DOI: https://doi.org/10.1093/biomet/73.3.755
(9). Ying So. A Tutorial on Logistic Regression [revista en internet]. Journal Of Marriage And The Family 1995; 57(4): 1-6. Disponi-ble en: http://www.mendeley.com/research/a-tutorial-on-logistic-regression/ DOI: https://doi.org/10.2307/353415
(10). Heinze G, Shemper M. A solution to the problem of separation in logistic regression. Statist. Med 2002; 21:2409-2419. DOI: https://doi.org/10.1002/sim.1047
(11). Firth D. Bias reduction, the Je_reys prior and glim. En: Fahrmeir L, Francis B, Gilchrist R, Tutz G, editores. Advances in glimand Statistical Modelling. New York: Springer-Verlag; 1992. p. 91-100. DOI: https://doi.org/10.1007/978-1-4612-2952-0_15
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2021 Juan C. Correa M., Marisol Valencia C.
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
El autor o los autores conserva(n) los derechos morales y cede(n) los derechos patrimoniales que corresponderán a la Universidad de Antioquia, para publicarlo, distribuir copias electrónicas, incluirlas en servicios de indización, directorios o bases de datos nacionales e internacionales en Acceso Abierto, bajo la licencia Creative Commons Atribución-No Comercial-Compartir Igual 4.0 Internacional Comercial (CC BY-NC-SA) la cual permite a otros distribuir, remezclar, retocar y crear a partir de la obra de modo no comercial, siempre y cuando se dé crédito respectivo y licencien las nuevas creaciones bajo las mismas condiciones.