Modèles de population en sciences de la vie
Equipe-projet commune avec l'INRIA Saclay-Ile de France.
Responsable:
Marc Lavielle, Directeur de Recherche Inria
Chercheurs permanents:
Eric Moulines, Professeur
Erwan Le Pennec, Professeur
Post-doc:
Angie Pineda
Doctorants:
Achille Thin
Pablo Jimenez
Assistante administrative:
Hanadi Dib
Thèmes de Recherche :
Développement de méthodes statistiques pour les modèles de population
Un objectif de Xpop est le développement de nouvelles méthodes statistiques pour les approches de population dans le domaine des sciences du vivant. De telles approches permettent de modéliser la variabilité inter-sujet des données recueillies dans un essai clinique.
L’approche de population est également pertinente en biologie cellulaire pour construire des modèles prédictifs de processus cellulaires dynamiques qui prennent en compte la variabilité intercellulaire. En effet, des cellules identiques d’un point de vue génétique et placées dans un environnement homogène spatialement répondent différemment à une même séquence de stimuli. Comprendre les origines de cette variabilité biologique est alors une question centrale, aussi bien pour comprendre l’impact de cette variabilité dans la machinerie cellulaire que pour construire des dispositifs expérimentaux robustes.
Méthodes MCMC pour les modèles de grande dimension
La grande dimension pose des problèmes spécifiques en simulation : les algorithmes de type Metropolis-Hastings basés sur de simples marches aléatoires sont peu efficaces pour des modèles de grandes dimension (i.e. lorsqu’il s’agit d’explorer la loi a posteriori d’un vecteur de grande dimension). De telles approches pour accélérer la convergence de l’algorithme ont déjà été envisagées (approche MALA, Metropolis Adjusted Langevin Algorithm), mais beaucoup reste à faire pour faire fonctionner ces méthodes en pratique. Notre objectif est de proposer des stratégies qui puissent être mises en oeuvre (échantillonnage par coordonnées ou blocs de coordonnées, influence de l’acceptation-rejet, du nombre de données) et donner des outils quantitatifs pour appréhender la convergence des algorithmes.
Modèles à données manquantes
Développement d’une plate-forme éducative
La plate-forme éducative Statistics in Action with R est principalement orientée vers l’enseignement de la modélisation statistique de données longitudinales. Cette plate-forme est d’accès libre pour tous, via une connexion Internet. Il s’agit de produire un matériel pédagogique d’auto-apprentissage sous forme de pages html intégrant des codes R, des applications interactives développées au moyen du package R Shiny, des animations web et des vidéos. Un des module de cette plate-forme est consacrée à la modélisation en pharmacométrie. Un tel programme se doit d’intégrer une formation rigoureuse dans différents domaines, comme la pharmacologie, les mathématiques et la statistique.
Développement du package mlxR
Le langage R a été massivement adopté ces dernières années par la communauté statistique, mais également par d’autres communautés d’utilisateurs de la statistique, comme l’industrie pharmaceutique où R est utilisé comme environnement de travail et comme logiciel polyvalent pour effectuer des taches aussi diverses que des simulations, des traitements statistiques ou encore des graphiques.
le package mlxR permet la simulation et la visualisation de données longitudinales de différents types (continues, catégorielles, comptage, survie) à partir de modèles statistiques complexes définis par des systèmes d’ODE (ordinary differential equations) ou de DDE (delayed differential equations).