• Réduire le texte
  • Rétablir taille du texte
  • Augmenter le texte
  • Imprimer

SeQuaStat: modélisation statistique pour l’intégration de données omiques. Application à l’étude de la qualité de semence.

Vue d'un écran de traitement informatique de données biologiques dans l'unité Métagénopolis.. © Bertrand NICOLAS - Inra, NICOLAS Bertrand
Mis à jour le 30/05/2017
Publié le 29/05/2017
Vue d'un écran de traitement informatique de données biologiques dans l'unité Métagénopolis.. © Bertrand NICOLAS - Inra, NICOLAS Bertrand
© Bertrand NICOLAS - Inra, NICOLAS Bertrand

Profil recherché: formation de type ingénieur généraliste avec de solides connaissances de base en statistiques et un intérêt pour les filières d’élevage

Durée : 36 mois à partir d’octobre 2017

Financement : CIFRE. Employeur : ALLICE (http://www.allice.fr/)
Laboratoires :    Génétique Animale et Biologie Intégrative (GABI) http://www6.jouy.inra.fr/gabi
Biologie du Développement et Reproduction (BDR) http://www6.jouy.inra.fr/bdr
INRA, centre de Jouy-en-Josas
Direction de thèse : Florence Jaffrezic (GABI). Co-encadrement : Hélène Kiefer (BDR)
Projet de thèse :
Le projet de thèse SeQuaStat se propose d’optimiser les modèles de prédiction de la fertilité des taureaux d’insémination animale, en développant des approches statistiques appropriées au traitement de données « omiques » de nature hétérogène. Ces approches permettront in fine d’améliorer le contrôle qualité de la semence et d’éviter la mise sur le marché de lots défectueux ou issus de taureaux subfertiles pouvant avoir un impact négatif sur l’élevage.
Ce projet s’inscrit dans la continuité du LabCom SeQuaMol (partenariat INRA/ALLICE financé par l’ANR et Apis-Gene), dont le but est d’identifier de nouveaux biomarqueurs de fertilité mâle en caractérisant la semence d’un point de vue moléculaire (petits ARN, méthylation de l’ADN, histones/protamines et modifications post-traductionelles, protéome, lipidome, glycome). La thèse exploitera les données omiques acquises dans le cadre de SeQuaMol, mais aussi les génotypes et les paramètres fonctionnels de la semence, afin de sélectionner les biomarqueurs pertinents et élaborer une prédiction fiable de la fertilité des taureaux ou de l’éjaculat. L’objectif sera de combiner les marqueurs nécessaires et suffisants, de manière à développer des outils viables sur le plan économique et pouvant être utilisés en routine. La thèse nécessitera l’adaptation de méthodes statistiques existantes et/ou le développement de nouvelles méthodes, de manière à intégrer les données (analyse factorielle multiple ou analyse de co-inertie multiple) et à identifier un set minimal de biomarqueurs prédictifs parmi un grand nombre de biomarqueurs hétérogènes dont aucun n’a d’effet majeur (approches de type IPF-Lasso et inférence de réseaux). Ces méthodes seront d’abord appliquées au premier jeu de données de SeQuaMol (n=94 taureaux, données disponibles) puis validées sur un second jeu de données (n=500). La dernière étape sera le développement d’un outil de prédiction sous forme d’un package R qui pourra par la suite être exploité par le laboratoire chargé du contrôle qualité de la semence.
La sélection des biomarqueurs pertinents et l’élaboration de l’équation de prédiction sont un prérequis au développement d’outils et de services économiquement compétitifs afin de permettre un contrôle qualité de routine de la semence. En donnant aux filières la possibilité d’accéder à ces outils et services innovants, la thèse sera déterminante pour accroitre la compétitivité des entreprises de sélection et des élevages.
Profil recherché : formation de type ingénieur généraliste avec de solides connaissances de base en statistiques et un intérêt pour les filières d’élevage
Modalités de recrutement : CV à envoyer à Florence Jaffrezic (florence.jaffrezic@inra.fr) et Hélène Kiefer (helene.kiefer@inra.fr) avant le mercredi 7 juin. Deux candidats seront sélectionnés pour passer un entretien avec des représentants d’ALLICE et les chercheurs INRA concernés le mardi 13 juin.