La liste des liens disponible ci-dessous vise à accompagner la formation "Initiation aux données de la recherche" proposée par l'URFIST de Paris. Elle permet aux participants d'avoir sous les yeux des renseignements complémentaires au support utilisé lors de l'exposé, et de retrouver le détail des informations mentionnées.

Cette sélection de liens vise prioritairement un groupe animé par un formateur, qui suit une démarche progressive en l'illustrant d'exemples.

1- Que sont les données de la recherche ?

Exemples de données

Géographie (IFREMER)

Zoologie (GBIF)

Astronomie (Simbad)

Chimie (Cristallography Open Database)

Génétique (GenBank)

Histoire (Siprojuris)

Histoire (Arolsen)

Linguistique (PFC)

Linguistique (Language Archive Cologne)

Différents types de données

Le projet MetaMARC

MetaMARC - Data paper

MetaMARC - Dépôt Zenodo

MetaMARC - Base MEGARes données référence

MetaMARC - Code Github

2- Pourquoi s'intéresser à ses données ?

Les données guident la science

Un trou noir pèse 5 petaoctets

Comment le stockage de données a permis la 1ère photo d'un trou noir

Un projet interdisciplinaire exemplaire en géographie

Quelques exemples de croisements de données afin de lutter contre le changement climatique

Les Registered Reports

Un exemple de Registered report

Les données valident la science

Retraction Watch : raisons pour lesquelles des articles sont rétractées

Un article sur les manipulations d'images

Un outil pour rechercher des erreurs dans des statistiques

Les données sont fragiles

Identification et validation de formats de fichiers

Identifier un format de fichier avec l'outil PRONOM

Comment stocker des données à (très) long terme ?

Classement et sauvegarde des données : quelle stratégie documentaire en fin de thèse ?

3- Métadonnées & documentation

1er niveau : vocabulaires standardisés

The RDA Metadata Standards Directory

Annuaire FAIRsharing de standards de métadonnées

Un exemple de JDD accompagné de son fichier de métadonnées

Tentative de standardisation des métadonnées : le projet MIAME (génomique)

2e niveau : valeurs standardisées

BARTOC FAST : interrogation fédérée de thésaurus

Datu : thésaurus de l'EHESS

3e niveau : encodages standardisés

Un ex. de métadonnées de thèse

Les métadonnées de la même thèse au format XML

Au-delà des métadonnées : la documentation

Documenter ses données en SHS : l'enquête sur l'enquête dans BeQuali

Documenter ses données en STM : le projet OpenLabNotebooks

4- Introduction au cadre juridique

Manipuler des données sous droits

L'art. 38 de la loi pour une République numérique : le Text and Data Mining

Données sous droit d'auteur : l’exception pédagogique et de recherche

Données personnelles et recherche scientifique : quelle articulation dans le RGPD ?

Publier des données

À qui appartiennent les données ? (L. Maurel)

L'art. 30 de la loi pour une République numérique

Quel statut pour les données de la recherche après la loi numérique ?

Ouverture des données de la recherche. Guide d'analyse du cadre juridique en France

Vers une obligation d'open data pour les thèses de doctorat ?

5- Diffuser, valoriser & réutiliser des données de recherche

DR intégrées dans article reproductible eLife

Ex. de données intégrées au code-source d'un article exécutable

Les données comme supplementary materials

Les Supplementary Data dans la revue PALAIOS

Un ex. d'article avec des supplementary data

Consignes auteurs PLoS One

Supplementary information dans Nature

Ancillary files dans arXiv

Les données dans des archives ouvertes

Sextant

MédiHAL

Types de dépôts dans HAL : les données de la recherche

Un ex. de données déposées dans HAL

Trouver un entrepôt

Le Registry of Open Access Repositories

OpenDOAR

La rubrique Data repositories de l'Open Access Directory

Répertoire FAIRsharing d'entrepôts de données

re3data.org

Entrepôts de confiance

Une liste d'entrepôts de confiance : le Trusted Digital Repository

Les entrepôts labellisés CoreTrustSeal

L'entrepôt Zenodo

L'entrepôt Figshare

L'entrepôt DataDryad

L'entrepôt Mendeley Data

Le projet d'entrepôt du CoSO

Dépôt de code

Github, pour diffuser du code

Le projet Software Heritage

Le dépôt de logiciels dans HAL

Métamoteurs

Le moteur BASE (Bielefeld Academic Search Engine)

DataCite Search

Google Dataset Search

Mendeley Data

ScholeXplorer

Citer des données de recherche

Pourquoi (faire) citer des données

(Faire) citer ses données avec DataCite

Principes de citation des données de recherche (Force11)

Formateur de citations (Crosscite)

Ex. citation Zenodo

Ex. citation & publi associée Figshare

Ex. citation & publi associée Dryad