Interview

Interview

La plateforme Odalim en 12 questions

https://odalim.inrae.fr/fr/

Après deux ans de développement la plateforme Odalim qui compte déjà 31 jeux de données de 7 domaines de l'alimentation est opérationnelle depuis le premier semestre 2020. Découvrez l'interview croisée avec Christine Boizot-Szantai, responsable du suivi scientifique de la plateforme et de Nicolas Guinet, chef de projet informatique de la plateforme.

Pourquoi avoir développé cette plateforme ?

La plateforme Odalim a pour premier objectif de regrouper sur un même site des bases de données multiples permettant de décrire les consommations et les produits alimentaires. Le deuxième objectif est de permettre la mise en relation de ces bases de données entre elles, de façon à faciliter les analyses multicritères requises pour les recherches dans le domaine de l’alimentation.

Qu’elle est d'après vous la valeur ajoutée de la plateforme ?

Les données proposées sur la plateforme couvrent une partie importante du champ de l’alimentation. Un premier ensemble de bases de données concerne la consommation et les achats alimentaires des ménages. Un deuxième ensemble porte sur les caractéristiques des produits alimentaires (nutritionnelles, ingrédients, paramètres d’étiquetage, contaminants, données sensorielles et de procédés). Certaines de ces bases de données sont produites par des organismes publics (Anses, Ademe…) ou privés (panels de consommateurs), d’autres encore sont produites par des équipes INRAE. La mise à disposition de ces bases de données par un portail unique est déjà en elle-même une valeur ajoutée, mais cette valeur ajoutée est augmentée par les outils et services que propose la plateforme. Vous pouvez en un seul endroit parcourir les données disponibles, leur documentation complète, en faire la demande et en obtenir l’accès. La plateforme propose aussi un serveur de calcul sécurisé pour traiter les données sensibles et des appariements entre les données qu'elle héberge, afin de faciliter les études multidimensionnelles dans le domaine de l'alimentation.

À quel type d’utilisateurs est destinée la Plateforme Odalim ? Qui peut y accéder et comment ?

Toute personne faisant partie d’INRAE peut accéder à la plateforme et demander l’accès aux données, outils et services qui y sont proposés sous réserve d’avoir au préalable déposé un descriptif de son projet à l’aide du formulaire dématérialisé disponible sur la plateforme. D’autre part, un agent qui a constitué une base de données sensibles qui contient par exemple des données à caractère personnel et devant respecter le Règlement Général sur la Protection des Données (RGPD) peut demander à utiliser le serveur de calcul sécurisé pour traiter ou faire traiter ses données.

Pouvez-vous nous en dire davantage au sujet de la demande d’accès aux données et aux outils et services ?

L'ensemble des jeux de données et des services doivent faire l'objet d'une demande d'accès à travers un projet avant leur acquisition. Les projets peuvent être multi-utilisateurs et multi-données. Suivant le jeu de données (OpenData, ou à licence restrictive), un processus d'acquisition incluant les gestionnaires des données est lancé. Si toutes les conditions sont réunies (approbation des gestionnaires, signature des licences etc.), les jeux de données sont accessibles par l'utilisateur. Cela peut (1) prendre la forme d'un accès au bureau distant, (2) donner la possibilité de télécharger les données directement sur son ordinateur, (3) ou donner accès aux données à travers les services hébergés sur la plateforme.

Quelles sont les exigences de la plateforme du point de vue de la qualité des données ?

Actuellement les données disponibles sur la plateforme proviennent toutes d’organismes ou de dispositifs reconnus tels que l’Anses, la société Kantar, l’ADEME ou encore le projet Oqali. Elles sont toutes accompagnées de règles d’utilisation et d’une documentation détaillée. La plateforme sera prochainement dotée d’un Plan de Gestion des Données (PGD) qui définira les règles d’acquisition et de conservation des données.

Un chercheur peut-il contribuer à la plateforme et déposer un jeu de données ?

Tout agent propriétaire de jeux de données du domaine de l'alimentation peut demander à ce que ses données soient hébergées sur notre plateforme pour diffusion à la communauté scientifique. Il profitera ainsi de tous les services de gestions proposés (serveur sécurisé, documentation, gestion de fichiers, des demandes etc.). Néanmoins, la base de données constituée par l’agent devra répondre aux critères définis dans le PGD avant de pouvoir être proposée sur la plateforme.

Comment les jeux de données de la plateforme sont-ils protégés ?

Les jeux de données sont hébergés sur le cloud INRAE redondés sur les deux datacenters de l’Institut. De cette façon, si un problème technique survient sur la plateforme et endommage ou en détruit tout ou partie, nous pouvons tout rétablir à l’identique sans rien perdre. L'accès aux ressources ne peut être autorisé que sur accord du gestionnaire de données pour un utilisateur authentifié. De plus, le niveau de sécurité permettant d'accéder à ces ressources peut varier suivant le choix des gestionnaires. Ainsi, certaines données sont accessibles à l’issue d’une double authentification, sous un format crypté, ou uniquement à travers le bureau distant sécurisé qui donne accès au serveur de calcul adossé à la plateforme.

Pouvez-vous nous en dire un peu plus au sujet du fonctionnement de la Plateforme Odalim ?

Comme nous l’avons déjà évoqué précédemment, l’un des points forts de la plateforme est d’assurer la sécurité des données qu’elle héberge et en particulier leur diffusion dans le respect des règles d’utilisation associées à chacune.  C’est un portail qui met tout en œuvre pour respecter les bonnes pratiques en matière de gestion des données, que ce soit au niveau de son infrastructure ou de ses fonctionnalités. Par exemple, l'ensemble des accès à la plateforme quels qu’ils soient sont enregistrés dans des fichiers nommés « log ». Cela permet de savoir "qui" a accédé à une ressource, "quand" et "pourquoi".

Quel est le « plus » apporté par le serveur sécurisé ?

Le serveur sécurisé est un espace de travail cloisonné qui donne accès à des logiciels comme Stata et R ainsi qu’à de la puissance de calcul. L’utilisateur peut y effectuer des traitements en toute sécurité à partir de n'importe quel ordinateur connecté à Internet à travers un bureau à distance sécurisé. Il donne ainsi accès à une infrastructure "homologuée" pour travailler sur des données sensibles à diffusion restreinte, et la liberté de pouvoir effectuer des traitements depuis n'importe quel lieu. Pour le gestionnaire de la donnée, il lui permet d'être sûr que ses données ne seront pas diffusées en dehors de la plateforme et utilisées à d'autres fins que celles décrites par l'utilisateur.

La plateforme sera-t-elle amenée à s'ouvrir vers d'autres institutions ?

La plateforme a été initialement conçue pour répondre aux besoins des chercheurs d’INRAE. Néanmoins, dans l’avenir, il est envisageable d’en élargir l’accès aux chercheurs d’autres organismes ou à d’autres partenaires. Bien sûr, certaines données dont l’accès est restreint resteront utilisables par les agents d’INRAE uniquement, mais la plateforme propose aussi l’accès à des données ouvertes et à des outils et services qui lui appartiennent et qu’elle peut diffuser comme elle le souhaite.

Quelles sont les prochaines étapes du développement de la plateforme ?

La plateforme va proposer une base de données multidimensionnelle sur le domaine de l'alimentation interrogeable via un seul et même outil. Ce projet qui demande du temps est en cours de développement.

Pouvez-vous nous dire qui contribue à l’élaboration de la plateforme ?

La plateforme Odalim est mise en œuvre et maintenue par l’unité ALISS. Elle est le produit du Pôle Alimentation Parisien (PAP) et du Méta-Programme DID’IT. Elle est soutenue par le département INRAE ECOSOCIO et  bénéficie de l’appui du CATI CITISES, de la DSI et du SESUP pour son infrastructure. Pour les questions juridiques et d’ouverture des données, elle reçoit les conseils de la Déléguée à la Protection des Données d’INRAE, ainsi que ceux des différentes structures nationales sur l’OpenScience et la FAIRisation. A travers l’élaboration de son cahier des charges et plusieurs des outils qu’elle propose, la plateforme Odalim est le fruit d’une collaboration durable entre les unités ALISS et TSE-R.