Ingénieur des données - H/F
L'entreprise
L’Institut pour la Recherche en Santé Publique (IReSP) est un groupement d’intérêt scientifique (GIS) créé en 2007 dont l'Inserm est l'organisme gestionnaire. Son objectif général est de développer, structurer et promouvoir la recherche en santé publique. L’IReSP soutient la recherche en Santé Publique par différents moyens, et en particulier au travers d’appels à projets, et d’action de valorisation et d’animation (www.iresp.net).
Contexte du Projet :
L'IReSP, en collaboration avec l'IT Santé Publique, développe un Portail national des études en santé, avec l’objectif de recenser l’ensemble des études de recherche en santé conduites en France.
Cette initiative s’inscrit dans le prolongement, l’extension et la modernisation du site « Portail Epidémiologie France » (https://epidemiologie-france.aviesan.fr/epidemiologie-france/catalogue), porté par l’Inserm et ses partenaires qui existe depuis une dizaine d’années.
Le but de ce nouveau projet, qui s’inscrit dans la dynamique de la Science Ouverte, est d’améliorer la visibilité les principales sources de données en santé disponibles en France et d’accéder à une description synthétique de leurs caractéristiques essentielles, de promouvoir les collaborations entre équipes de recherche, et de faciliter la réutilisation secondaire des données.
Le projet bénéficie du soutien de l’Etat dans le cadre du plan « France 2030 ».
Le poste
Mission principale :
Au sein de l’équipe projet FRESH et en lien avec le prestataire informatique en charge du développement, la personne recrutée conçoit et met en œuvre la stratégie, les principes et les standards de collecte, de stockage et d’exploitation des données du catalogue FReSH.
Elle est responsable de la gestion des flux d’harmonisation et de FAIRisation des métadonnées du catalogue. Elle apporte une expertise approfondie sur les standards de métadonnées et accompagne la mise en œuvre des solutions de gestion des métadonnées développées par le prestataire informatique.
Activités principales :
· En collaboration avec le prestataire informatique, prototyper les solutions techniques et prouver leur viabilité,
· Être responsable de la maintenance et l’évolution du modèle de données du catalogue ainsi que des différents flux des données,
· Implémenter des standards existants reconnus afin d’assurer l’interopérabilité du catalogue avec les autres initiatives existantes,
· Identifier rapidement les anomalies ou les points bloquant et les remonter à l’équipe du prestataire,
· Assurer une veille technologique autour des standards de métadonnées et l’interopérabilité,
· Agir en tant que porte-parole technique dans son domaine d'expertise,
· Participer aux réunions et groupes de travail avec les partenaires nationaux et internationaux.
Spécificité(s) et environnement du poste :
· Pas de contrainte particulière
Profil recherché
Connaissances :
· Connaissance des principes et processus relatifs aux données, aux métadonnées, aux référentiels, au stockage de données et à l'architecture technique ;
· Connaissance des principes de la science ouverte et de l’ouverture des données de la recherche, du cycle de vie des données et des principes FAIR ;
· Connaissance des standards et vocabulaires de structuration des données et des métadonnées pertinents dans le domaine de la santé humaine et génériques (DDI, DCAT, DataCite, …) ;
· Connaissance des formats d’échange de données (XML, JSON) et des standards associés de validation et de transformation (XSLT, XSD, JSON Schema) ;
· Connaissances en technologies du web sémantique (RDF, OWL, SPARQL) et de Linked Data ;
· Connaissance des architectures logicielles pour le développement web ;
· Connaissances relatives à l’écosystème de la donnée et/ou de la recherche académique et clinique ;
· Une connaissance de la législation, de la réglementation du domaine, du RGPD et/ou des règles d’accessibilité numérique serait un plus.
Savoir-faire :
· Expertise des méthodologies et des concepts de la science des données ;
· Capacité à examiner les modèles et à formuler des recommandations pratiques ;
· Maîtrise de différents logiciels professionnels couramment utilisés dans le secteur d'activité ;
· Expérience de la modélisation des données, de la création de flux des données, de l’intégration de données hétérogènes ;
· Expérience dans le fonctionnement des interfaces de programmation d’application (API REST) et des technologies web (HTML, PHP, JavaScript, …) ;
· Maîtrise de la gestion des données structurées et non structurées ;
· Pratique avancée d’au moins un langage de programmation (de préférence, Python, R, SQL, etc.) ;
· Expérience en intégration de données et de web services ;
· Maitrise des outils de gestion de versions (Git) ;
· Expérience de la méthodologie et des outils de développement agile (ex. Jira) ;
· Savoir transmettre des compétences et animer des ateliers et formations.
Aptitudes :
· Excellentes capacités d'analyse et de résolution de problèmes ;
· Capacité à prendre des décisions et à faire preuve de discernement ;
· Faire preuve d’organisation, de réactivité, de rigueur et de méthode ;
· Capacité à se saisir de nouveaux sujets et de monter en compétences rapidement ;
· Communication orale et écrite efficace ;
· Travailler en autonomie et également en équipe.
Expérience(s) souhaité(s) :
· Une expérience confirmée (minimum 3 ans) dans l’ingénierie de données, de préférence des données de recherche dans le domaine de la santé.
Niveau de diplôme et formation(s) :
Niveau Master 2+ ou ingénieur, en informatique, bio-informatique, ingénierie, science des données ou autre domaine pertinent.
Éléments nécessaires pour postuler
Pour valider votre candidature, nous vous demandons de fournir les éléments suivants, vous devrez télécharger les pièces demandées directement lors de votre inscription.
Toute candidature incomplète ne sera pas traitée par nos services.
Document(s) :
- Curriculum Vitæ
- Lettre de motivation
Candidature facile