La separación en regresión logística, una solución y aplicación

Autores/as

  • Juan C. Correa M. Universidad Nacional de Colombia
  • Marisol Valencia C. Universidad Pontificia Bolivariana

DOI:

https://doi.org/10.17533/udea.rfnsp.8770

Palabras clave:

modelo logístico, estimación de máxima verosimilitud, menarquia

Resumen

La regresión logística es una de las técnicas estadísticas más aplicadas cuando se busca explicar el comportamiento probabilístico de algún fenómeno. Un problema que aparece con frecuencia en estos modelos es la separación en los datos, mostrando los grupos de éxitos separados de los fracasos, lo que impide hallar los estimadores de máxima verosimilitud. Objetivo: Presentar una revisión y solución del problema, comparando con otras existentes. Metodología: Simulación del modelo logístico y estimación del sesgo de los parámetros, usando la solución propuesta con el método clásico. Bayesiano y observaciones ficticias y con el método de Firth. Resultados: Los sesgos encontrados son menores al generar el par de observaciones ficticias con el método Bayesiano. Se muestra un ejemplo sobre la edad de la menarquia. Discusión: Se aporta una solución adecuada al problema de la separación usando simulación en un esquema de modelo logístico sencillo. Conclusiones: la generación de observaciones ficticias se recomienda dentro de la región de separación y el mejor método de solución está basado en la teoría bayesiana, donde se logra una convergencia en los parámetros del modelo logístico.

|Resumen
= 197 veces | PDF
= 76 veces|

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Juan C. Correa M., Universidad Nacional de Colombia

Doctorado en Estadística, Universidad de Kentucky. Docente, Universidad Nacional de Colombia, Medellín, Colombia.

Marisol Valencia C., Universidad Pontificia Bolivariana

Magíster en Estadística, Universidad Nacional de Colombia, docente, Universidad Pontificia Bolivariana, Medellín, Colombia.

Citas

(1). Albert A, Anderson JA. On the existence of maximum likeliho-od estimates in logistic regression models. Biometrika 1984;71: 1-10. DOI: https://doi.org/10.1093/biomet/71.1.1

(2). Christmann A, Rousseeuw PJ. Measuring overlap in binary regression. Computational Statistics and Data Analysis 2001; 37: 65-75. DOI: https://doi.org/10.1016/S0167-9473(00)00063-3

(3). Christmann A, Rousseeuw PJ. Robustness against separation and outliers in logistic regression, Computational Statistics and Data Analysis 2003;43: 315-332. DOI: https://doi.org/10.1016/S0167-9473(02)00304-3

(4). King E, Ryan TP. A preliminary investigation of maximum likeli-hood logistic regression versus Exact logisic Regression. Ameri-can Statistical Association 2002; 56 (3): 163-170. DOI: https://doi.org/10.1198/00031300283

(5). Lesaffre E, Albert A. Partial Separation in Logistic Discrimination. Journal of the Royal Statistical Society. Series B (Methodo-logical) 1989; 51(1): 109-116. DOI: https://doi.org/10.1111/j.2517-6161.1989.tb01752.x

(6). Rindskopf D. Infinite parameter estimates in logistic regression: Opportunities, not problems. Journal of Educational and Behavioral Statistics 2002; 27(2): 147-161. DOI: https://doi.org/10.3102/10769986027002147

(7). Gentleman R, Ihaka R. R: A Language and Environment for Statistical Computing. R Development Core Team [internet] R Foundation for Statistical Computing: Vienna; 2009 [acceso 07 de noviembre de 2010]. Disponible en: www.R-project.org..

(8). Santner TJ, Duffy DE. A note on A. Albert and J. A. Anderson’s conditions for the existence of maximum likelihood estimates in logistic regression models. Biometrika 1986; 73(3): 755-758. DOI: https://doi.org/10.1093/biomet/73.3.755

(9). Ying So. A Tutorial on Logistic Regression [revista en internet]. Journal Of Marriage And The Family 1995; 57(4): 1-6. Disponi-ble en: http://www.mendeley.com/research/a-tutorial-on-logistic-regression/ DOI: https://doi.org/10.2307/353415

(10). Heinze G, Shemper M. A solution to the problem of separation in logistic regression. Statist. Med 2002; 21:2409-2419. DOI: https://doi.org/10.1002/sim.1047

(11). Firth D. Bias reduction, the Je_reys prior and glim. En: Fahrmeir L, Francis B, Gilchrist R, Tutz G, editores. Advances in glimand Statistical Modelling. New York: Springer-Verlag; 1992. p. 91-100. DOI: https://doi.org/10.1007/978-1-4612-2952-0_15

Descargas

Publicado

2012-01-24

Cómo citar

1.
Correa M. JC, Valencia C. M. La separación en regresión logística, una solución y aplicación. Rev. Fac. Nac. Salud Pública [Internet]. 24 de enero de 2012 [citado 22 de enero de 2025];29(3):281-8. Disponible en: https://revistas.udea.edu.co/index.php/fnsp/article/view/8770

Número

Sección

Investigación