Resumen:
En general se asume que una muestra posee las mismas características básicas que la población que representa. Sin embargo, en la práctica esto podría no ocurrir y surgen los denominados datos sesgados. Este tipo de muestras se origina cuando la probabilidad de elegir una observación depende de su valor y/o de otras variables de interés. Aparecen ejemplos de manera natural en ámbitos como la Biomedicina, el Control de Calidad o la Economía, entre otros.
El objetivo general de este trabajo es el estudio y posible adaptación de técnicas clásicas de la
Inferencia Estadística al contexto de datos sesgados. Nos centraremos fundamentalmente en la estimación de curvas de interés como la función de distribución, la función de densidad y la función cuantil.
La generalidad de esta temática permitiría desarrollar tanto un trabajo de corte más teórico
como uno más orientado a la programación de estas técnicas con el paquete estadístico R. En ambos casos se ilustrarán los contenidos empleando bases de datos reales.
Borrajo, M. I., González-Manteiga, W., y Martínez-Miranda, M. D. (2017). “Bandwidth selection
for kernel density estimation with length-biased data”. Journal of Nonparametric Statistics, 29,
636-668.
Cox, D. (2005), “Some sampling problems in technology”, en Selected Statistical Papers of Sir
David Cox, Vol. 1, eds. D. Hand y A. Herzberg, Cambridge University Press, 81-92.
Efromovich, S. (2004), “Density estimation for biased data”, Annals of Statistics, 32, 1137-1161.
Efromovich, S. (2004). “Distribution estimation for biased data”. Journal of Statistical Planning
and Inference, 124, 1-43.
Jones, M.C. (1991), “Kernel density estimation for length biased data”, Biometrika, 78, 511-519.
Shi, J., Ma, H., y Zhou, Y. (2018). “The nonparametric quantile estimation for length-biased and
right-censored data”. Statistics & Probability Letters, 134, 150-158.
|