Resumen del trabajo fin de master



Título: Significación estadística en alta dimensión
Universidad que ofrece el proyecto: Universidade de Vigo
Director/a:
de Uña Álvarez, Jacobo
Resumen:
Los datos de alta dimensión aparecen con frecuencia en un número cada vez mayor de ámbitos del conocimiento humano. Un problema que se presenta en tal contexto es el de las comparaciones o contrastes múltiples ya que, debido a la alta dimensión, la conveniencia de un determinado criterio de significación estadística puede verse comprometida. Esto afecta por ejemplo a la comparación de una cantidad ingente de poblaciones, a la comparación de unos pocos grupos a partir de un número elevado de variables estadísticas, o a la selección de variables relevantes en regresión, predicción y/o clasificación dentro de un conjunto de candidatos de gran cardinalidad. En este trabajo se revisan, precisamente, distintos criterios de significación estadística que se han propuesto en la literatura de comparaciones múltiples, y se estudian sus principales propiedades en el contexto altodimensional. En particular, se discutirá la importancia de tener en cuenta el carácter discreto de los p-valores, si es el caso, o su naturaleza homogénea discreta, para definir métodos de comparaciones múltiples adecuados. El problema de la posible dependencia entre los (múltiples) estadísticos de contraste será asimismo abordado. Los métodos se aplicarán a escenarios simulados y a datos reales, y los resultados se discutirán de manera crítica; también se revisará el software estadístico relacionado.
Más información