La Separación en Regresión Logística, una solución y aplicación.

  • Marisol Valencia C. Docente
  • Juan C. Correa M.
Palabras clave: Modelo logístico, Estimación de Máxima Verosimilitud, Menarquia

Resumen

La regresión logística es una de las técnicas estadísticas más aplicadas cuando se busca explicar el comportamiento probabilístico de algún fenómeno. Un problema que aparece con frecuencia en estos modelos es la separación en los datos, mostrando los grupos de éxitos separados de los fracasos, lo que impide hallar los estimadores de máxima verosimilitud. Objetivo: Presentar una revisión y solución del problema, comparando con otras existentes. Metodología: Simulación del modelo logístico y estimación del sesgo de los parámetros, usando la solución propuesta con el método clásico. Bayesiano y observaciones ficticias y con el método de Firth. Resultados: Los sesgos encontrados son menores al generar el par de observaciones ficticias con el método Bayesiano. Se muestra un ejemplo sobre la edad de la menarquia. Discusión: Se aporta una solución adecuada al problema de la separación usando simulación en un esquema de modelo logístico sencillo. Conclusiones: la generación de observaciones ficticias se recomienda dentro de la región de separación y el mejor método de solución está basado en la teoría bayesiana, donde se logra una convergencia en los parámetros del modelo logístico.
|Resumen
= 1 veces | PDF
= 11 veces|

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Marisol Valencia C., Docente

Docente

Universidad Pontificia Bolivariana

Juan C. Correa M.

PhD. en Estadística, University of Kentucky, Docente Universidad Nacional de Colombia, Sede Medellín

Citas

(1). Albert A, Anderson JA. On the existence of maximum likeliho-od estimates in logistic regression models. Biometrika 1984;71: 1-10.

(2). Christmann A, Rousseeuw PJ. Measuring overlap in binary re-gression. Computational Statistics and Data Analysis 2001; 37: 65-75.

(3). Christmann A, Rousseeuw PJ. Robustness against separation and outliers in logistic regression, Computational Statistics and Data Analysis 2003;43: 315-332.

(4). King E, Ryan TP. A preliminary investigation of maximum likeli-hood logistic regression versus Exact logisic Regression. Ameri-can Statistical Association 2002; 56 (3): 163-170.

(5). Lesaffre E, Albert A. Partial Separation in Logistic Discrimina-tion. Journal of the Royal Statistical Society. Series B (Methodo-logical) 1989; 51(1): 109-116.

(6). Rindskopf D. Infinite parameter estimates in logistic regression: Opportunities, not problems. Journal of Educational and Behavioral Statistics 2002; 27(2): 147-161.

(7). Gentleman R, Ihaka R. R: A Language and Environment for Statistical Computing. R Development Core Team [internet] R Foundation for Statistical Computing: Vienna; 2009 [acceso 07 de noviembre de 2010]. Disponible en: www.R-project.org..

(8). Santner TJ, Duffy DE. A note on A. Albert and J. A. Anderson’s conditions for the existence of maximum likelihood estimates in logistic regression models. Biometrika 1986; 73(3): 755-758.

(9). Ying So. A Tutorial on Logistic Regression [revista en internet]. Journal Of Marriage And The Family 1995; 57(4): 1-6. Disponi-ble en: http://www.mendeley.com/research/a-tutorial-on-logistic-regression/

(10). Heinze G, Shemper M. A solution to the problem of separation in logistic regression. Statist. Med 2002; 21:2409-2419.

(11). Firth D. Bias reduction, the Je_reys prior and glim. En: Fahrmeir L, Francis B, Gilchrist R, Tutz G, editores. Advances in glimand Statistical Modelling. New York: Springer-Verlag; 1992. p. 91-100.

Publicado
2012-01-24
Cómo citar
Valencia C., M., & Correa M., J. C. (2012). La Separación en Regresión Logística, una solución y aplicación. Revista Facultad Nacional De Salud Pública, 29(3). Recuperado a partir de https://revistas.udea.edu.co/index.php/fnsp/article/view/8770
Sección
Investigación