Resumen del trabajo fin de master



Título: Comparación de poblaciones en datos circulares
Universidad que ofrece el proyecto: Universidade de Santiago de Compostela
Director/a:
Ameijeiras Alonso, Jose;  Borrajo García, María Isabel
Resumen:
Uno de los problemas más estudiados en el ámbito de la estadística es la comparación de dos (o más) muestras. Este problema puede abordarse de manera puntual mediante la comparación de alguna característica (medias, medianas, varianzas, …), pero también de manera global mediante la comparación de funciones de distribución o de densidad. Entre los contrastes noparamétricos más conocidos para la comparación de dos muestras se encuentran las pruebas de Kolmogorov–Smirnov y Cramér–von Mises, cuyos estadísticos se basan en la distancia supremo o cuadrática, respectivamente, entre las funciones de distribución empíricas. El segundo estadístico ha sido propuesto también en términos de la comparación de funciones de densidad estimadas. Centrándonos en este último, Hall (1984) analizó el error cuadrático integrado entre una densidad y el correspondiente estimador núcleo, Anderson et al. (1994) desarrollaron estadísticos basados en esas ideas previas para testear la igualdad de dos densidades multivariantes, y Duong et al. (2012) derivaron la normalidad asintótica del estadístico de tipo L2 entre estimadores tipo núcleo de la densidad multivariante. El problema de comparación de distribuciones a través de estimadores tipo núcleo de la densidad no es solo de interés en el contexto clásico uni o multivariante, sino también en otras áreas como la estadística espacial o los datos circulares. La estimación núcleo de la densidad en datos circulares presenta sus propias características al tener que lidiar con variables periódicas cuyo soporte no es el espacio euclídeo, ver Taylor (2008). En este trabajo se pretende abordar el problema de comparación de dos muestras en el contexto de datos circulares a través de la métrica L2, extendiendo para ello las ideas desarrolladas en el contexto de datos lineales. Las aplicaciones potenciales incluyen la comparación en las direcciones en las que migran dos especies distintas de aves, o determinar si la dirección del viento en una cierta localización varía entre estaciones. Referencias Anderson, N. H., Hall, P., y Titterington, D. M. (1994). Two-sample test statistics for measuring discrepancies between two multivariate probability density functions using kernel-based density estimates. Journal of Multivariate Analysis, 50(1), 41–54. Duong, T., Goud, B., y Schauer, K. (2012). Closed-form density-based framework for automatic detection of cellular morphology changes. Proceedings of the National Academy of Sciences, 109(22), 8382–8387. Hall, P. (1984). Central limit theorem for integrated square error of multivariate nonparametric density estimators. Journal of Multivariate Analysis, 14(1), 1–16. Mardia, K. V., Jupp, P. E., y Mardia, K. V. (2000). Directional Statistics. Wiley. Taylor, C. C. (2008). Automatic bandwidth selection for circular density estimation. Computational Statistics and Data Analysis, 52(7), 3493-3500.
Más información