UNIVERSITE
Imputation et Malaria
Stage de M2 2012
Laboratoires d’accueil : Laboratoire Mathématiques Appliquées - Paris 5 (MAP5) et Faculté de Pharmacie IRD UMR 216
Lieu du stage : Laboratoire Mathématiques Appliquées - Paris 5 (MAP5)
Encadrement : Audrey Sabbagh (IRD), Gregory Nuel (MAP5)
Contact : envoyez un CV détaillé et une lettre de motivation à Audrey Sabbagh (IRD), Gregory Nuel (MAP5)
Durée du stage : 6 mois
Rémunération : environ 400 euros par mois
Sujet : Séquençage poolé et imputation pour l’étude de l’implication du gène ARHGAP26 dans le contrôle du niveau d’infection par P. falciparum dans une cohorte d’enfants sénégalais.
Description : La notion de susceptibilité génétique au paludisme est aujourd’hui largement admise par la communauté scientifique. Malgré cela les mécanismes physiopathologiques sous jacents restent incompris. Cette incompréhension est renforcée par le fait que les résultats obtenus dans le domaine demeurent discordants et ce, quelles que soient les méthodes utilisées (liaison ou association, approches gène candidat ou génome entier) et malgré les progrès réalisés tant dans le domaine de la génétique moléculaire que sur le plan biostatistique. Très récemment nous avons réalisé une étude pangénomique qui nous a permis pour la première fois d’identifier un gène candidat dans la région 5q31-33, par la mise en évidence d’une association génétique forte d’un polymorphisme situé dans le gène ARHGAP26 localisé dans cette région. Ce gène est fortement impliqué dans des voies métaboliques de la réponse immunitaire et de la physiologie de l’endothélium vasculaire, élément important du processus infectieux palustre. Ces éléments font de ARHGAP26 un gène candidat potentiellement important qu’il est indispensable d’explorer afin de mieux saisir son rôle pour éventuellement ouvrir des pistes originales pour la prévention du paludisme (molécules thérapeutiques ou vaccinales).
Le projet de recherche dans lequel s’intègre le stage a pour objectif d’affiner les résultats de l’étude d’association pangénomique que nous avons réalisée au Sénégal, en identifiant dans le gène ARHGAP26 le variant causal directement impliqué dans le contrôle de la réponse à l’infection palustre. Pour cela nous proposons d’utiliser une technologie extrêmement récente de séquençage poolé et des techniques statistiques d’imputations multiples. Cette approche en deux temps (séquençage puis imputation) permet de diminuer le coût du projet tout en maintenant une puissance d’analyse grâce au développement d’outils statistiques adaptés.
L’imputation est une technique qui consiste à attribuer une valeur à un ensemble de marqueurs non observés en se fondant pour cela sur les valeurs des marqueurs observés voisins et sur un petit nombre (car coûteuses) d’observations jointes de l’ensemble des marqueurs. Les techniques statistiques impliquées relèvent des modèles à données incomplètes (type chaînes de Markov cachées).
Le stage consistera dans un premier temps à recenser les outils disponibles permettant d’effectuer l’imputation, puis à les mettre en œuvre sur les données récoltées afin de comparer leur performances. Dans un deuxième temps, le stagiaire pourra s’intéresser au développement d’un nouveau modèle d’imputation prenant en compte les spécificités du projet.
Le ou la candidate aura une solide formation en statistique, un goût certain pour la programmation et un réel intérêt pour les applications dans le domaine biomédical. Alternativement, le ou la candidate pourra avoir une formation initiale dans le domaine biomédical (ex : génétique, épidémiologie) doublée d’une forte attirance pour les approches statistiques et la programmation.
Notions abordées :
En statistique :
- modèles de chaînes de Markov cachées (HMM en anglais)
- algorithme forward/backward
- observations incomplètes/incertaines
- algorithme EM
- marqueurs SNPs
- séquençage haut débit
- génotypes et haplotypes
- taux de recombinaison
Dans la même rubrique :
- Santé, Dépendance et Prévention : une analyse exploratoire
- Variations quadratiques du mouvement brownien fractionnaire
- Réseaux Bayesiens pour la prise en compte du Recensement dans les études de Ségrégation
- Systèmes à une infinité de particules en interaction et applications
- La cohérence globale de phase peut-elle mesurer la clarté d’un son ?
