Aller au contenu principal
Retour au site principal de la Bibliothèque de l'ÉTS
 

La gestion des données de recherche (GDR): Documentation et métadonnées

Ce guide diffuse de l'information et des ressources pour appuyer la communauté de recherche de l'ÉTS dans la gestion des données de recherche.

RÔLES ET RESSOURCES EN DOCUMENTATION

Rôle de la documentation
 

La documentation des données peut être définie comme la description claire de tout ce qu'un nouvel "utilisateur de données" ou "votre futur-moi" aurait besoin de savoir pour trouver, comprendre, reproduire et réutiliser vos données, de manière indépendante et sans risque d'interprétation erronée.

Elle doit décrire clairement comment vous avez généré ou utilisé les données, pourquoi et où trouver les fichiers associés. Elle pourrait également être utilisée comme documentation d'intégration pour les nouveaux collègues, même si le chercheur responsable quitte le projet. L'élaboration d'un plan de gestion des données (PGD) peut faciliter l'élaboration de la documentation.

La documentation des données est nécessaire à deux niveaux : la documentation sur l'ensemble de l'étude ou du projet et la documentation sur les enregistrements individuels, les observations ou les points de données. (Adapté de ELIXIR Belgium, 2020)

Voici une liste d'éléments importants à considérer pour assurer une documentation adaptée qui facilitera le repérage de l’information, le partage des données au sein de l’équipe de recherche et leur possible réutilisation tout en veillant à leur assurer une pérennité tout au long de leur vie utile (Université de Sherbrooke, 2022) :

  • les hypothèses formulées;
  • l’approche méthodologique utilisée;
  • les types et procédures d’analyse;
  • la description des données recueillies;
  • le dictionnaire des données qui définit les variables utilisées ainsi que les objets;
  • les concepts clés, les vocabulaires, les systèmes de classification;
  • les unités de mesure;
  • les outils ou logiciels utilisés, les codes sources;
  • les renseignements sur les personnes ayant travaillé au projet et réalisé chacune des tâches;
  • ETS_LISEZ-MOI_Gabarit
    Fichier texte contenant un gabarit en français pour la création d'un fichier LISEZ-MOI
  • ETS_README_Template
    Fichier texte contenant un gabarit en anglais pour la création d'un fichier README
Rôle des métadonnées
 
Les métadonnées sont une documentation très structurée. Les métadonnées lisibles par machine ou exploitables rendent vos (méta)données plus trouvables, accessibles, interopérables et réutilisables. Elles augmentent donc la qualité et la visibilité des données auprès d’une communauté scientifique, et par conséquent leur potentiel de réutilisation et de reconnaissance. Elles sont aussi utiles pour la préservation numérique à long terme des données. Les métadonnées devraient être accompagnées de la documentation suffisante (comme les manuels de logiciels, la conception des enquêtes et les guides d'utilisation, etc.), préparée par la personne qui a créé les données, afin de permettre l'utilisation de la ressource par d'autres. (Adaptée de Digital Preservation Coalition, 2021)
Contenu recommandé du fichier LISEZ-MOI
 
Le contenu recommandé pour la réutilisation des données.(Cornell, 2023).
Informations générales
  • Fournir un titre pour l'ensemble de données
  • Contacts = Nom /institution /adresse /courriel pour:
    • Chercheur principal (ou personne responsable de la collecte des données)
    • Associé ou co-chercheurs
    • Personne-ressource
  • Date de collecte des données (peut être une date unique ou une plage)
  • Informations sur l'emplacement géographique de la collecte de données
  • Mots-clés utilisés pour décrire le sujet des données
  • Informations linguistiques
  • Informations sur les sources de financement qui ont soutenu la collecte des données
Aperçu des données et des fichiers
  • Pour chaque nom de fichier, une brève description des données qu'il contient
  • Format du fichier s'il n'est pas évident d'après le nom du fichier
  • Si l'ensemble de données comprend plusieurs fichiers liés les uns aux autres, la relation entre les fichiers ou unedescription de la structure des fichiers qui les contient(la terminologie possible pourrait inclure « ensemble de données », « étude » ou « paquet de données »)
  • Date de création du fichier
  • Date(s) à laquelle le(s) fichier(s)ont été mis à jour(versionnés) et nature de la ou des mise(s) à jour, le cas échéant
  • Informations sur les données associées collectées, mais qui ne figurent pas dans l'ensemble de données décrit
Partager et accéder aux informations
  • Licences ou restrictions imposées sur les données
  • Liens vers des publications qui citent ou utilisent les données
  • Liens vers d'autres emplacements de données accessibles au public (voir les meilleures pratiques de partage de données pour plus d'informations sur l'identification des référentiels)
  • Citation recommandée pour les données (voir les meilleures pratiques pour la citation des données)
Informations méthodologiques
  • Description des méthodes de collecte ou de génération de données (inclure des liens ou des références à des publications ou à d'autres documents contenant la conception expérimentale ou les protocoles utilisés)
  • Description des méthodes utilisées pour le traitement des données (décrire comment les données ont été générées à partir des données brutes ou collectées)
  • Toute information spécifique au logiciel ou à l'instrument nécessaire pour comprendre ou interpréter les données, y compris les numéros de version du logiciel et du matériel.
  • Normes et informations sur le calibrage des appareils de mesure, le cas échéant
  • Décrire toutes les procédures d'assurance qualité appliquées aux données
  • Définitions de codes ou de symboles utilisés pour noter ou caractériser des valeurs de mauvaise qualité/discutables/aberrantes dont les chercheurs devraient être conscients
  • Personnes impliquées dans la collecte, le traitement, l’analyse et/ou la soumission des échantillons
Informations spécifiques aux données

**Répétez cette section si nécessaire pour chaque ensemble de données (ou fichier, le cas échéant)**

  • Nombre de variables et nombre d'observations ou de lignes
  • Liste de variables, comprenant les noms complets et les définitions (épeler les mots abrégés) des en-têtes de colonnes pour les données tabulaires
  • Unités de mesure
  • Définitions des codes ou symboles utilisés pour enregistrer les données manquantes
  • Formats spécialisés ou autres abréviations utilisées

Meilleures pratiques en bref pour formater un LISEZ-MOI

  • 1er document à créer au commencement du projet
  • L’enregistrer au niveau supérieur du répertoire du projet
  • Lui donner un nom qui sera facilement associé aux fichiers de données qu'il décrit
  • Écrivez votre document LISEZ-MOI sous forme de fichier texte – (éviter les formats propriétaires comme MS Word) – les formats ouverts sont toujours plus pérennes.
  • Créer un LISEZ-MOI pour chaque fichier de données identiques
  • Formater de manière identique tous vos fichiers LISEZ-MOI (utilisez la même terminologie)
  • Utilisez des formats de dates normalisés

Ressources externes

Directives et modèles de fichier LISEZ-MOI / README

Références

ELIXIR Belgium (2020). RDM guide. Repéré à https://rdm.elixir-belgium.org/about_DMP

Digital Preservation Coalition (DPC) 2021. Manuel de préservation numérique. Repéré à https://www.dpconline.org/docs/digital-preservation-handbook2/2519-handbook-2021-fr/file

Université Sherbrooke (2022). Gestion des données de recherche: Documenter son projet et ses processus. Repéré à https://libguides.biblio.usherbrooke.ca/gdr/documenter

Make a README, 2018. Repéré à https://www.makeareadme.com/

Guide to writing “readme” style metadata. Cornell University. Repéré à https://data.research.cornell.edu/data-management/sharing/readme/