
Formation pour les étudiants, enseignants et chercheurs
Open Science Open Data 28 mars 2017 à Agropolis International
Programme de la journée
La Commission IST Agropolis International, l’ADBS et Doccitanist, avec le soutien de Couperin.org organisent le 28 mars 2017 une journée sur l’Open Science et l’Open Data.
Nous accorderons de longs temps d’échanges entre les intervenants et la salle.
MATINEE: OPEN SCIENCE ET OPEN DATA
- 08:30 Accueil des participants
- 09:00 Introduction générale de la matinée
- 09:15 Les nouveaux modes de publications (O. Hologne, Inra)
- 09:30 – 10:30 Présentation des projets et discussions sous forme de table ronde
- Présentation du projet « Peer community in evolutionary Biology » (D. Bourguet, Inra)
- Présentation du projet Numerev (L. Verlaet et J. Mary, MSH Sud)
- Retour d’expérience sur la revue REMVT (D. Bastianelli, Cirad)
PAUSE : 10:30 – 11:00
- 11:00 Open Data (O. Hologne, Inra)
- 11:15 Les aspects juridiques des données de la recherche (C. Martin, Irstea)
- 11:30 – 12:30 Retour d'expériences et discussions sous forme de table ronde
- Retour d'expérience sur l'écriture d'un plan de gestion de données ( S. Auzoux et S. Paradis, Cirad)
- Présentation du GBIF (S. Pamerlon, GBIF)
- Retour d’expérience sur la rédaction de data papers (R. Pélissier, IRD)
- Conclusion de la matinée (D. Bourguet, Inra)
REPAS : 12:30 -14:00
APRES-MIDI : ATELIERS PRATIQUES DONNEES DE LA RECHERCHE
Des ateliers pratiques organisés et animés par des professionnels de l'IST d'une durée de 45 minutes seront proposés et répétés en fonction du nombre de participants. Il s'agit de présenter concrètement les différents aspects de gestion des données de la recherche.
Quatre ateliers sont prévus :
- Rechercher / Réutiliser les données de la recherche
- Déposer des données dans Zenodo
- Rédiger un plan de gestion de données
- Rédiger un data paper
Matinée Open Science / Open Data (présentations et vidéos)
Captations vidéo et présentations des intervenants de la matinée.
Toutes les vidéos sur la chaîne Vimeo opendatagropolis
Introduction de la journée / Bernard Hubert, Président d’Agropolis International
Bernard Hubert, Président d’Agropolis International présente en quelques mots l’association Agropolis International et se félicite de l’intérêt porté par la communauté scientifique sur la thématique de l’Open Science. 140 personnes se sont inscrites à cette journée dont 80 chercheurs et enseignants. L’Open Access annonce de grands changements dans la façon de publier et il rappelle que des journées comme celle-ci ou celle qui a été organisée par l’Inra en janvier 2017 sont très importantes pour les chercheurs. Force est de constater que de nombreuses initiatives apparaissent et Bernard Hubert fait référence à la Loi pour une République Numérique qui facilite l’accès et la diffusion de la production scientifique française. En tant que rédacteur en chef d’une revue [Natures Sciences Sociétés. [http://www.nss-journal.org] Bernard Hubert parle brièvement des évolutions proposées par l’Open Access.
Les nouveaux modes de publication / Odile Hologne, déléguée IST de l'Inra
Odile Hologne a accepté à 2 titres de participer à cette journée. D’une part, l’open Science et l’Open Data sont des sujets passionnants, qui lui tiennent particulièrement à cœur, et d’autre part, parce que la date coïncide avec la « WeekIST » de l’Inra, semaine où les documentalistes Inra organisent dans les différents centres Inra de nombreuses animations pour faire découvrir les services IST aux chercheurs, dont tous ceux qui gravitent autour des données. Cette conférence est suivie en streaming dans de nombreux centres Inra.
L’intervention d’Odile Hologne permet de dresser un état des lieux de l’édition scientifique et d’interpeler les scientifiques pour les inciter à publier autrement.
- chiffres de l’édition scientifique avec un CA de 7Milliards de $ pour les grands éditeurs.[source site eprist]
- Le numérique impacte toutes les facettes de la publication scientifique. Les 4 fonctions des journaux (enregistrement, diffusion, révision et archivage) qui étaient organisées par les éditeurs peuvent aujourd’hui être modifiées et réalisées dans des environnements dissociés. Doit-on rester à un format pdf, copie du papier ? On note le développement du rôle des preprints et des archives ouvertes (peercommunityin.org, #Asapbio)
- Peut-on se passer des éditeurs commerciaux ? Les stratégies des éditeurs changent (cf Elsevier qui propose des services d'évaluation, de management de la recherche, ...) et bibliothèques peuvent jouer un rôle dans la publication.
- Face aux nouvelles formes de publication des résultats de la recherche (bases de données, plateformes de traitement, mégajournaux, …), les questions autour de l’utilité du journal et de la linéarité des articles sont posées : L’article doit être structuré, connecté à d'autres sources d'information, intéractif pour naviguer dans un corpus de données, certains invitent à la nanopublication
- Comment publier mieux et autrement ? s’éloigner de course au facteur d’impact, faire de la « sloppy science », publier les résultats négatifs et protocoles, tout cela apporte de la transparence et garantit la reproductibilité de la science.
- Faire évoluer les critères d’évaluation des chercheurs
Peer community in evolutionary Biology / Denis Bourguet, Inra
https://evolbiol.peercommunityin.org/
Denis Bourguet déplore la perversion du système par les grands éditeurs, alors que les chercheurs exercent toutes les fonctions attribuées aux revues donc autant se réapproprier le circuit de publication. On peut noter une montée en puissance des pre-prints en biologie sur les archives ouvertes.
Le PCI - Peer community in est système de recommandation de preprints Projet lancé en 2016, avec la première communauté PCI in Evolutionnary Biology en janvier 2017 (162 membres à la création, 270 à ce jour, une 20aine de recommandations de postprints, de requêtes). Le modèle économique de ce système est essentiellement en temps humain. Ce projet bénéficie du soutien de l’Inra, d’Agropolis Fondation et des UMR impliquées (avec 10K€ pour l’infrastructure matérielle).
Projet Numerev / Lise Verlaet, Université Paul Valéry Montpellier et Julien Mary, MSH Sud
Numerev est un projet de portail interdisciplinaire de ressources scientifiques numériques qui se donne notamment pour mission d'être un incubateur scientifique et un vecteur privilégié de science ouverte (open science ou open research).
Retour d'expérience : Devenir open pour une petite revue : le parcours de la REMVT (Revue d'élevage et de médecine des pays tropicaux /Journal of tropical Livestock Science) / Denis Bastianelli, Cirad
Suite à une réorganisation du Cirad, un contact avec le DOAJ a été pris pour permettre le référencement des articles de la revue via cette plateforme. Cette décision a impliqué plusieurs changements au niveau du fonctionnement de la revue, mais aussi du Cirad (archivage pérenne, guichet DOI Cirad pour attribuer un DOI pour chaque article, réflexion sur les licences Creatives Commons, signalement de la politique éditoriale en faveur du libre accès sur le site de références Sherpa Roméo). Actuellement, la revue réfléchie à la possibilité de publier également des Data Paper. Cette expérience sera probablement transposable aux autres revues éditées par le Cirad.
Conclusion de la table ronde : Odile Hologne conclut les échanges en précisant qu’il existe de très nombreux projets comme ceux présentés dans cette table ronde (on peut noter la plateforme de revues Open Access (OENO-One et le « Journal of Plant Hydraulics» ) portée par l’Université de Bordeaux , les Epirevues), ce qui est louable en période de mutation mais à terme est-ce viable ? Il faudra converger au niveau national, européen et international vers des infrastructures.
Un rappel est fait sur ResearchGate et la captation des données au détriment des chercheurs. Odile Hologne recommande de déposer dans des infrastructures publiques garantes d’un archivage pérenne.
Données de la recherche : données ouvertes ? / Odile Hologne, Inra
Après un rappel des différents types d’accès aux données, Odile Hologne souligne que dans le code de la recherche, les organismes doivent organiser l’accès libre aux données. Pour les publications scientifiques, le chercheur est titulaire des droits. Pour les données, c’est bien plus complexe. Même s’ils n’ont pas l’obligation de mettre en place des entrepôts de données, les organismes de recherche doivent produire le catalogue de données pour les mettre à disposition. Odile Hologne rappelle que la Communauté Européenne est très active en matière d'ouverture : Open Innovation, Open Science, Open to the World (cf Horizon 2020 : data management plan). Elle encourage à publier les données sous-jacentes à l'article (Open aire pour les publications, OpenAire+ et Zenodo pour les données). Les données doivent être considérées comme un nouveau produit de la recherche et doivent être intégrées au rapport d'évaluation. En tant que publications, les Data Papers sont un moyen de valoriser le dépôt de données.
Aspects juridiques des données de la recherche/ Caroline Martin, Irstea
Cette intervention a porté sur l'Open Data en recherche en présentant le contexte normatif français, les évolutions importantes suite à la loi "Lemaire" ainsi que le travail inter-établissements dans la rédaction d'un guide d'analyse juridique sur l'ouverture des données en recherche. Les objectifs de la diffusion des données de la recherche sont la transparence de l’action publique, la participation des citoyens à l’élaboration des choix publics et l’augmentation de l’innovation.
Guide juridique au service des chercheurs
L’Inra en 2012 est à l'origine d'un GT inter-établissements qui va publier en décembre 2016 un guide qui s’intitule : “Ouverture des données de recherche. Guide d’analyse du cadre juridique en France” Publié par un collectif d’organismes de recherche, ce document précise les modalités de communication des données qui, selon leur nature, peut être rendue obligatoire, interdite, ou soumise à conditions. Ce document de référence explicite par ailleurs les principes à respecter en matière de diffusion des données. Il rappelle les critères techniques à satisfaire pour atteindre la qualification de “données ouvertes” et oriente sur le choix délicat de la licence de diffusion, et les modalités de diffusion. Il fournit enfin un logigramme d’aide à la décision et une série de fiches pratiques.
Présentation du réseau GBIF (Global Biodiversity Information Facility) free & open access to biodiversity data / Sophie Pamerlon, GBIF
Lancé par l’OCDE en 2001, le système mondial d’information sur la biodiversité (Global Biodiversity Information Facility, ou GBIF) est l’infrastructure la plus importante au monde proposant un accès libre et gratuit à plus de 715 millions d’occurrences sur la biodiversité, afin de soutenir la science, les politiques de conservation et le développement durable. Cette intervention présente le réseau GBIF, ses outils et standards, ainsi que les DOI, les licences liées aux jeux de données dans le réseau GBIF et les Data Paper.
Retour d'expérience : rédaction d'un PGD ou DMP - Data Management Plan / Sandrine Auzoux et Sébastien Paradis, Cirad
S. Audoux et S. Paradis ont été confrontés à la rédaction d’un plan de gestion de données dans le cadre de 2 projets de recherche :
- Le projet STRADIV (System approach for the TRAnsition to bio-DIVersified agroecosystems) ambitionne de créer un référentiel multidisciplinaire du rôle de la biodiversité végétale dans les agrosystèmes pour supporter leur transition vers des systèmes écologiquement intensifs et définir des règles génériques.
- Le projet ArchiWood avait pour objectif de produire, sous forme d'un jeu de données diffusé librement, une nouvelle source d'informations sur la biodiversité de Madagascar (morphologie végétale, anatomie et architecture des plantes) par la numérisation de données provenant de nos collections patrimoniales."
Leur retour d’expérience a permis de montrer les bénéfices pour les chercheurs (bonnes pratiques, réflexion sur éthique et aspects juridiques, valorisation et archivage des données, …), mais aussi le collectif de chercheurs (vue globale sur le projet et le flux de données produites). Le PGD apparait comme un outil en support au management transversal. Pour l’institution, la rédaction de PGD permet d’afficher une politique de partage des données et d’avoir des informations pour alimenter son catalogue de données.
Retours d'expérience sur la rédaction de data papers / Raphaël Pélissier, Ird, UMR AMAP
Les Data Papers représentent une forme de valorisation simple des données de la recherche. Ils permettent de documenter (métadonnées) des données primaires ou élaborées, collectées à l’occasion de projets de recherche individuels ou collectifs, d’en assurer une certaine pérennité (archivage, DOI), d’en reconnaitre la paternité (citations) et d’en fixer les conditions de ré-utilisation par d’autres acteurs.
Quelques exemples sont présentés à partir d’une expérience en écologie de la végétation.
Pour un chercheur, rédiger un Data Paper permet de faire connaître dispositif expérimental, décrire protocole pour faciliter présentation du jeu de données dans études ultérieures et surtout, de rendre public (et donc réutilisable) un jeu de données menacé d'être perdu.
Echanges avec la salle
De nombreuses questions posées concernent les aspects juridiques des données. A qui appartient un jeu de données produits par différentes institutions ? Qui peut le déposer ? Dans quelle mesure une licence Creatives Commons non-commerciale me protège à l’étranger ? Que faire en cas d’utilisation commerciale ? Le chef de projet Open data pour la Métropole de Montpellier est intervenu pour indiquer que même un géant comme Google respectait les licences de type ODBL. C’est une licence virale, obligation de citer la source et de diffuser cela la même licence. obligation de citer la source, ODBL est virale, base de données portera la même version. On peut aussi utiliser la licence CC car plus de chances d'être reconnu dans les décrets (Loi Lemaire).
Plusieurs liens utiles ont été rappelés :
- DMP OPIDoR (cf. atelier Rédiger un PGD)
- Poster PDG Cirad
- Dora Num : accès aux MOOCS
- datapartage.inra.fr : gestion et partage des données
Conclusion de la matinée / Denis Bourguet, Inra
La dynamique vers l’ouverture des données est inévitable. L’ouverture aux données peut se faire avec un modèle privé ou public. Les objectifs pour accompagner ce mouvement sont d’identifier les outils à disposition, évaluer la crédibilité de ces outils aux yeux des chercheurs et évaluer l’usage qui en sera fait.
Ateliers pratiques sur les données de la recherche (présentations et vidéos)
Atelier « Rechercher et réutiliser les données de la recherche », animé par Dominique Fournier et Christine Silvy, Inra – 4 sessions – 74 participants
L'objectif de cet atelier est de présenter des outils de recherche de jeux de données, les conditions d'utilisation des données (via les licences) et leur citation dans le cas d'une ré-utilisation sous forme d'article.
La première partie de l'atelier est une présentation générale des outils de recherche (annuaires, moteurs, bases de données ...), des licences et du format de citation des données via les DOI.
La deuxième partie consiste en une présentation détaillée des différents outils, illustrée de nombreux exemples, permettant aux participants de prendre connaissance de la licence correspondante et du format de citation.
Atelier sur les données de la recherche : Comment les rechercher et les réutiliser ? opendatagropolis, 28.03.17 publié par Agropolis International sur la chaîne opendatagropolis.
Atelier « Déposer des données dans Zenodo », animé par Elise Delande, Montpellier SupAgro et François Gibier, Université de Montpellier – 2 sessions – 44 participants
L'atelier "déposer dans Zenodo" a essentiellement consisté en une démonstration pratique d'un dépôt. Il s'agit d'un entrepôt choisi pour sa multidisciplinarité et son caractère généraliste et simple d'approche.
Après une brève introduction avec quelques éléments de présentation générale de la plateforme (financement, date de lancement, nombre et type de documents disponibles), nous avons réalisé un dépôt en déroulant les étapes successives depuis l'inscription du déposant jusqu'à l'enregistrement final du document.
Atelier pratique sur les données de la recherche : Déposer dans Zenodo - 28.03.17, Montpellier, opendatagropolis publié par Agropolis International sur la chaîne opendatagropolis.
Atelier « Rédiger un plan de gestion de données (PGD) ou Data Management Plan (DMP)», animé par Annabelle Filatre, AgroParisTech et Hanka Hensens, IRD – 3 sessions – 60 participants
Cet atelier pratique s'est basé sur l'outil d'aide à la création de plans de gestions de données DMP Opidor (Data Maganement Plan pour une Optimisation du Partage et de l'Interopérabilité des Données de la Recherche, https://dmp.opidor.fr/), développé par la cellule IST du Cnrs avec l'appui de la Bibliothèque Scientifique Numérique. Le modèle "Horizon 2020 Fair DMP" (FAIR signifie Findable, Accessible, Interoperable and Reusable) a été décliné pour un projet ANR réel, correspondant aux centres d'intérêts d'Agropolis, en explicitant au fur et à mesure des écrans du formulaire les informations qui y sont attendues. L'atelier a suscité de nombreuses questions et interactions avec les animateurs, dans les petites salles (moins en amphi).
Téléchargez la présentation
Téléchargez les copies d'écran
Atelier pratiques sur les données de la recherche : Rédiger un PGD/DMP #opendatagropolis publié par Agropolis International sur la chaîne opendatagropolis
Atelier « Rédiger un data paper », animé par Isabelle Nault, Irstea et Yannick Brohard, Cnrs – 3 sessions – 60 participants
Le data paper est une publication scientifique décrivant un jeu de données ou un ensemble de jeux de données scientifiques brutes à l’aide d’informations précises, les métadonnées. Le data paper présente le contexte de leur production et facilite leur réutilisation.
Lors de l’atelier, nous avons présenté les data journals, la structure d’un data paper, les coûts, les outils d’aide à la rédaction, puis la diffusion et le partage des données via les entrepôts et enfin nous avons abordé les bénéfices d’une publication d’un data paper.
Atelier sur les données de la recherche : Rédiger un Data Paper , #opendatagropolis, Montpellier, 28.03.2017 publié par Agropolis International sur la chaîne opendatagropolis.
Retours en images et vidéo
Retours en images
Bientôt disponibles, quelques témoignages vidéo de participants à la journée opendatagropolis
- Contact(s)
- Téléchargement
Détails
Visualisation
- Prochaine(s) formation(s)