Data Manager / Biostatisticien - H/F
L'entreprise
L’Inserm est le seul organisme public français entièrement dédié à la recherche biologique, médicale et en santé des populations. Il dispose de laboratoires de recherche sur l’ensemble du territoire, regroupés en 12 Délégations Régionales. Notre institut réunit 15 000 chercheurs, ingénieurs, techniciens et personnels administratifs, avec un objectif commun : améliorer la santé de tous par le progrès des connaissances sur le vivant et sur les maladies, l’innovation dans les traitements et la recherche en santé publique.
Rejoindre l’Inserm, c’est intégrer un institut engagé pour la parité et l’égalité professionnelle, la diversité et l’accompagnement de ses agents en situation de handicap, dès le recrutement et tout au long de la carrière. Afin de préserver le bien-être au travail, l’Inserm mène une politique active en matière de conditions de travail, reposant notamment sur un juste équilibre entre vie personnelle et vie professionnelle.
L'Inserm a reçu en 2016 le label européen HR Excellence in Research et s'est engagé à faire évoluer ses pratiques de recrutement et d'évaluation des chercheurs.
L’IRD est un organisme public français de recherche dédié à la production et au partage de connaissances pour relever les grands défis mondiaux — santé, environnement, climat et développement — en étroite collaboration avec les pays du Sud. Dans ce cadre, l’UMMISCO (Unité Mixte de Modélisation Mathématique et Informatique des Systèmes Complexes) développe depuis plus de vingt ans des recherches à l’interface des mathématiques, de l’informatique et des sciences des systèmes complexes, avec un fort ancrage en intelligence artificielle et analyse de données, au service de problématiques à fort impact scientifique et sociétal.
Le C.I.C. est une unité de recherche portant sur des patients ou des volontaires sains.
L’objectif du C.I.C. est de mettre à disposition des cliniciens et chercheurs du GHPS des locaux adaptés à leurs recherches cliniques et du personnel médical et paramédical formés aux exigences méthodologiques actuelles.
Le poste
Mission principale :
Le projet ELDORA vise à développer des approches d’intelligence artificielle efficaces, rapides et interprétables pour la détection et la prédiction d’arythmies malignes et de myocardites liées aux immunothérapies (ICI) à partir de signaux ECG.
Sous la responsabilité des 2 encadrants, Dr Edi PRIFTI (L’UMMISCO / IRD) et Pr Joe-Elie SALEM (CIC Paris-Est), la personne recrutée jouera un rôle central dans la gestion, la structuration et l’exploitation statistique de données cliniques et ECG issues de cohortes multi-sources nationales et internationales (France, États-Unis, etc.), en garantissant leur qualité, leur harmonisation et leur conformité réglementaire. Le poste est situé à l’interface entre l’équipe IA de recherche (IRD–UMMISCO) et l’équipe clinique AP-HP/INSERM Pitié-Salpêtrière, au sein d’un écosystème international très collaboratif.
Activités principales :
Gestion et gouvernance des données
- Cartographier les sources de données et concevoir les modèles de données, dictionnaires et métadonnées.
- Mettre en œuvre les principes FAIR et les exigences RGPD au sein des plans de gestion des données (DMP).
- Assurer la traçabilité, la documentation et la gestion des accès aux données.
Qualité et curation des données
- Superviser les flux d’ingestion, les contrôles qualité automatiques et les audit trails.
- Effectuer l’harmonisation des données (formats ECG, unités, cohérence temporelle, pseudonymisation).
- Mettre en place des workflows de transformation reproductibles (ETL, versioning, intégration continue).
Capture et intégration des données
- Configurer et administrer des systèmes de capture électronique (EDC, ex. REDCap ou équivalent).
- Concevoir les CRFs, gérer les droits d’accès et assurer la conformité avec les équipes cliniques et DPO.
Préparation des jeux analytiques
- Construire les jeux d’entraînement et de validation pour les modèles IA.
- Documenter et versionner les pipelines de transformation (Git, CI/CD, containers).
- Contribuer à la reproductibilité et à la transparence des jeux de données utilisés pour l’analyse.
Analyses statistiques et reporting
- Réaliser les analyses descriptives et inférentielles (imputation, régressions, ROC/PR, calibration, survie).
- Contribuer à l’évaluation des performances des modèles IA et aux réanalyses par sous-groupes.
- Produire des rapports dynamiques et tableaux de bord (R Markdown, Quarto, notebooks).
- Participer à la rédaction de publications et à la valorisation scientifique.
Coordination et collaboration transverses
- Assurer l’interface entre les équipes UMMISCO/IRD, CIC-APHP et les partenaires internationaux (VUMC, UCSF).
- Participer aux réunions du consortium, aux audits qualité et à la production des livrables.
Spécificité(s) et environnement du poste :
Le poste s’inscrit au sein du consortium international ELDORA, réunissant :
- UMMISCO / IRD (coordination IA)
- CIC Pitié-Salpêtrière – AP-HP (coordination clinique)
- Vanderbilt University Medical Center (USA), UCSF (USA) et partenaires industriels européens.
Vous bénéficierez d’un accès privilégié à des bases ECG multi-cohortes, à une infrastructure de calcul et de données cliniques à grande échelle, et à un environnement de recherche interdisciplinaire au croisement de l’IA, de la cardiologie et de la recherche translationnelle.
Profil recherché
Connaissances :
- Connaissances des modèles de données cliniques (OMOP, CDISC, HL7 FHIR) et des systèmes EDC (REDCap ou équivalent).
- Connaissance des bases de données SQL et des outils de visualisation (ggplot2, Plotly, Matplotlib).
Savoir-faire :
- Maîtrise de R et/ou Python (tidymodels, scikit-learn, Pandas, NumPy).
- Bonnes pratiques de versioning et reproductibilité (Git/GitLab, Docker, CI/CD).
- Familiarité avec les signaux ECG ou données biomédicales ; environnement HPC/SLURM apprécié
Aptitudes :
- Rigueur, sens de l’organisation et esprit analytique.
- Excellentes capacités de communication avec cliniciens, ingénieurs et chercheurs.
- Aisance rédactionnelle en français et anglais
Expérience(s) souhaité(s) :
- Expérience confirmée dans la gestion et l’analyse de données cliniques ou biomédicales.
- Bonne connaissance des projets collaboratifs multi-acteurs et des standards qualité (SOPs, audit trail).
Niveau de diplôme et formation(s) :
- Master, diplôme d’ingénieur ou doctorat en data management, biostatistique, data science, santé publique ou domaine connexe.
Éléments nécessaires pour postuler
Pour valider votre candidature, nous vous demandons de fournir les éléments suivants, vous devrez télécharger les pièces demandées directement lors de votre inscription.
Toute candidature incomplète ne sera pas traitée par nos services.
Document(s) :
- Curriculum Vitæ
- Lettre de motivation
Candidature facile