La liste des liens disponible ci-dessous vise à accompagner la formation "Initiation aux données de la recherche" proposée par l'URFIST de Paris. Elle permet aux participants d'avoir sous les yeux des renseignements complémentaires au support utilisé lors de l'exposé, et de retrouver le détail des informations mentionnées.

Cette sélection de liens vise prioritairement un groupe animé par un formateur, qui suit une démarche progressive en l'illustrant d'exemples.

1- Que sont les données de la recherche ?
Exemples de données
Géographie (IFREMER)
Zoologie (GBIF)
Astronomie (Simbad)
Chimie (Cristallography Open Database)
Génétique (GenBank)
Histoire (Siprojuris)
Histoire (Arolsen)
Linguistique (PFC)
Linguistique (Language Archive Cologne)
Différents types de données
Le projet MetaMARC
MetaMARC - Data paper
MetaMARC - Dépôt Zenodo
MetaMARC - Base MEGARes données référence
MetaMARC - Code Github
2- Pourquoi s'intéresser à ses données ?
Les données guident la science
Un trou noir pèse 5 petaoctets
Comment le stockage de données a permis la 1ère photo d'un trou noir
Un projet interdisciplinaire exemplaire en géographie
Quelques exemples de croisements de données afin de lutter contre le changement climatique
Les Registered Reports
Un exemple de Registered report
Les données valident la science
Retraction Watch : raisons pour lesquelles des articles sont rétractées
Un article sur les manipulations d'images
Un outil pour rechercher des erreurs dans des statistiques
Les données sont fragiles
Identification et validation de formats de fichiers
Identifier un format de fichier avec l'outil PRONOM
Comment stocker des données à (très) long terme ?
Classement et sauvegarde des données : quelle stratégie documentaire en fin de thèse ?
3- Métadonnées & documentation
1er niveau : vocabulaires standardisés
The RDA Metadata Standards Directory
Annuaire FAIRsharing de standards de métadonnées
Un exemple de JDD accompagné de son fichier de métadonnées
Tentative de standardisation des métadonnées : le projet MIAME (génomique)
2e niveau : valeurs standardisées
BARTOC FAST : interrogation fédérée de thésaurus
Datu : thésaurus de l'EHESS
3e niveau : encodages standardisés
Un ex. de métadonnées de thèse
Les métadonnées de la même thèse au format XML
Au-delà des métadonnées : la documentation
Documenter ses données en SHS : l'enquête sur l'enquête dans BeQuali
Documenter ses données en STM : le projet OpenLabNotebooks
4- Introduction au cadre juridique
Manipuler des données sous droits
L'art. 38 de la loi pour une République numérique : le Text and Data Mining
Données sous droit d'auteur : l’exception pédagogique et de recherche
Données personnelles et recherche scientifique : quelle articulation dans le RGPD ?
Publier des données
À qui appartiennent les données ? (L. Maurel)
L'art. 30 de la loi pour une République numérique
Quel statut pour les données de la recherche après la loi numérique ?
Ouverture des données de la recherche. Guide d'analyse du cadre juridique en France
Vers une obligation d'open data pour les thèses de doctorat ?
5- Diffuser, valoriser & réutiliser des données de recherche
DR intégrées dans article reproductible eLife
Ex. de données intégrées au code-source d'un article exécutable
Les données comme supplementary materials
Les Supplementary Data dans la revue PALAIOS
Un ex. d'article avec des supplementary data
Consignes auteurs PLoS One
Supplementary information dans Nature
Ancillary files dans arXiv
Les données dans des archives ouvertes
Sextant
MédiHAL
Types de dépôts dans HAL : les données de la recherche
Un ex. de données déposées dans HAL
Trouver un entrepôt
Le Registry of Open Access Repositories
OpenDOAR
La rubrique Data repositories de l'Open Access Directory
Répertoire FAIRsharing d'entrepôts de données
re3data.org
Entrepôts de confiance
Une liste d'entrepôts de confiance : le Trusted Digital Repository
Les entrepôts labellisés CoreTrustSeal
L'entrepôt Zenodo
L'entrepôt Figshare
L'entrepôt DataDryad
L'entrepôt Mendeley Data
Le projet d'entrepôt du CoSO
Dépôt de code
Github, pour diffuser du code
Le projet Software Heritage
Le dépôt de logiciels dans HAL
Métamoteurs
Le moteur BASE (Bielefeld Academic Search Engine)
DataCite Search
Google Dataset Search
Mendeley Data
ScholeXplorer
Citer des données de recherche
Pourquoi (faire) citer des données
(Faire) citer ses données avec DataCite
Principes de citation des données de recherche (Force11)
Formateur de citations (Crosscite)
Ex. citation Zenodo
Ex. citation & publi associée Figshare
Ex. citation & publi associée Dryad