Resumen del trabajo fin de master



Título: Comparación de técnicas estadísticas para evaluar el parentesco, estructura poblacional y ancestralidad genética
Universidad que ofrece el proyecto: Universidade de Santiago de Compostela
Director/a:
Febrero Bande, Manuel
Alumno/a:
Felpeto Evia, Jorge
Resumen:
En los estudios de asociación de genoma completo (genome wide association studies, GWAS) normalmente se realiza la comparación de las frecuencias alélicas entre un grupo de casos (individuos con una patología o rasgo fenotípico de interés) y un grupo de población control (individuos sanos o que no muestran dicho rasgo). Una parte importante del proceso de control de calidad que hay que realizar antes del análisis estadístico de las diferencias entre las variables consiste en evaluar 1) la existencia de parentesco, 2) la posible estratificación (diferencias genéticas de fondo entre casos y controles, no relacionadas con la patología o fenotipo de estudio) y 3) el origen ancestral común de los individuos del estudio. En la literatura se han utilizado diversas técnicas estadísticas para valorar cada uno de estos aspectos (análisis de componentes principales, PCA, por ejemplo), pero todas ellas se basan en cierta forma en caracterizar la distancia o similitud genética entre individuos, por lo que con frecuencia los resultados son confusos: individuos de ancestralidad semejante son interpretados como parientes o distorsionan la distribución observada en el PCA con el que normalmente se caracteriza la existencia de estratificación. El problema se agrava en los estudios en los que hay población de diferentes orígenes ancestrales, pues en ese caso conviene realizar los análisis por separado. En el marco del proyecto SCOURGE, en el que se analiza la base genética de la severidad del COVID19, se dispone de una población numerosa de casos de origen mezclado y gran número de individuos emparentados. Los datos de dicho proyecto, genotipados con un array de alta densidad e imputados a más de seis millones de posiciones del genoma, permitirían poder evaluar y comparar las diversas técnicas existentes en un caso especialmente complejo y definir la correcta pipeline como parte del proceso de control de calidad.
Más información