Apprenti.e Ingénieur.e Data & Intelligence Artificielle - H/F

L'entreprise

L’Inserm est le seul organisme public français entièrement dédié à la recherche biologique, médicale et en santé des populations. Il dispose de laboratoires de recherche sur l’ensemble du territoire, regroupés en 12 Délégations Régionales. Notre institut réunit 15 000 chercheurs, ingénieurs, techniciens et personnels administratifs, avec un objectif commun : améliorer la santé de tous par le progrès des connaissances sur le vivant et sur les maladies, l’innovation dans les traitements et la recherche en santé publique.

Rejoindre l’Inserm, c’est intégrer un institut engagé pour la parité et l’égalité professionnelle, la diversité et l’accompagnement de ses agents en situation de handicap, dès le recrutement et tout au long de la carrière. Afin de préserver le bien-être au travail, l’Inserm mène une politique active en matière de conditions de travail, reposant notamment sur un juste équilibre entre vie personnelle et vie professionnelle.

L'Inserm a reçu en 2016 le label européen HR Excellence in Research et s'est engagé à faire évoluer ses pratiques de recrutement et d'évaluation des chercheurs.

Le poste

Mission principale :

La personne recrutée participera à la structuration, la mise en qualité et la valorisation des données cliniques du département de radiothérapie, en collaboration étroite avec le pôle Data et l’unité de recherche 1355, dans le but de constituer des jeux de données exploitables pour le développement de modèles d’intelligence artificielle de prédiction de la réponse aux traitements.


Activités principales :

·          Analyse des sources de données cliniques et techniques liées à la radiothérapie

·          Structuration, normalisation et harmonisation des données

·          Mise en place de pipelines de traitement automatisés (Python, SQL, outils d’orchestration)

·          Contribution à la gouvernance et à la traçabilité des données (qualité, complétude, reproductibilité)

·          Conception et application de méthodes de traitement des données manquantes (imputation, filtrage, contrôle de qualité) dans les pipelines de données.

·          Collaboration avec les chercheurs de l’unité 1355 pour la préparation des datasets destinés à l’entraînement de modèles IA

·          Participation à la documentation technique et méthodologique des flux de données

Profil recherché

Connaissances :

·          Bases solides en informatique, data science et statistiques

·          Connaissances en traitement et structuration de données

·          Sensibilité aux enjeux liés aux données de santé (confidentialité, qualité, traçabilité)

Savoir-faire :

·          Programmation en Python

·          Requêtage et manipulation de bases de données (SQL)

·          Automatisation de workflows data (RPA, pipelines)

·          Mise en place de contrôles qualité et d’indicateurs de complétude des datasets

·          Intégration du traitement des données manquantes dans des pipelines de préparation de données

·          Capacité à structurer et documenter des jeux de données complexes


Aptitudes :

·          Esprit analytique et rigueur scientifique

·          Capacité à travailler en équipe pluridisciplinaire

·          Autonomie, curiosité et force de proposition

·          Bon sens de la communication technique

Éléments nécessaires pour postuler

Pour valider votre candidature, nous vous demandons de fournir les éléments suivants, vous devrez télécharger les pièces demandées et passer le(s) test(s) directement lors de votre inscription.

Toute candidature incomplète ne sera pas traitée par nos services.

Document(s) :

  • Curriculum Vitæ
  • Lettre de motivation

Evaluation(s) :

  • Entretien différé

    Entretien différé

    L'entretien différé est un questionnaire à compléter. Suivant les questions, vous répondez en vidéo ou à l'écrit.

Candidature facile