Donnée, information et métadonnée
Ce qu'il faut comprendre
Tu manipules des données tous les jours sans t'en rendre compte : quand tu regardes la météo sur ton téléphone, quand tu cherches un film sur Netflix, ou quand tu fais une liste de courses. Mais une donnée brute, toute seule, ne veut pas dire grand-chose. C'est quand on lui donne du sens qu'elle devient une information. Et pour bien organiser et comprendre les données, on utilise des métadonnées, comme des étiquettes qui décrivent les données.
Dans ce cours, tu vas apprendre à distinguer une donnée d'une information, à reconnaître les métadonnées, et à manipuler des données structurées dans des formats comme le CSV et le JSON. Tu verras aussi comment trier et filtrer des données, et ce qu'est l'open data.
Les notions essentielles
Donnée, information et métadonnée
- Donnée : c'est une valeur brute, sans contexte. Par exemple : « 15 », « Paris », « 2025-03-28 ». Toute seule, elle ne veut pas dire grand-chose.
- Information : c'est une donnée mise en contexte, qui a du sens. Par exemple : « La température à Paris le 28 mars 2025 est de 15 °C. »
- Métadonnée : c'est une donnée qui décrit une autre donnée. Par exemple, pour une photo, les métadonnées peuvent être la date de prise de vue, l'appareil utilisé, la taille du fichier, etc.
Table
Une table est un ensemble de données organisées en lignes et en colonnes. Chaque colonne représente un attribut (par exemple : nom, âge, ville), chaque ligne représente un enregistrement (une personne, un objet, etc.).
CSV (Comma-Separated Values)
Le CSV est un format de fichier texte qui stocke des données tabulaires. Chaque ligne correspond à une ligne de la table, et les valeurs sont séparées par des virgules (ou parfois des points-virgules). Exemple :
nom,age,ville
Alice,15,Paris
Bob,16,Lyon
JSON (JavaScript Object Notation)
Le JSON est un format de fichier texte qui stocke des données structurées sous forme de paires clé-valeur. Il est très utilisé pour échanger des données sur le web. Exemple :
[
{"nom": "Alice", "age": 15, "ville": "Paris"},
{"nom": "Bob", "age": 16, "ville": "Lyon"}
]
Tri et filtre
- Trier : classer les données selon un ordre (alphabétique, numérique, chronologique). Par exemple, trier une liste d'élèves par ordre alphabétique.
- Filtrer : ne garder que les données qui répondent à un critère. Par exemple, filtrer les élèves qui habitent à Paris.
Open data
L'open data (données ouvertes) désigne des données mises à disposition de tous, librement accessibles et réutilisables. Par exemple, les données météo, les horaires de bus, les résultats du bac (mais on ne dit pas Bac !).
Méthode
Pour passer d'une donnée à une information
- Identifier la donnée brute : par exemple, « 12 ».
- Ajouter du contexte : unité, date, lieu, source. Exemple : « 12 °C à Paris le 1er avril 2025 ».
- Interpréter : « Il fait frais pour la saison. »
Pour lire un fichier CSV
- Ouvre le fichier avec un éditeur de texte ou un tableur.
- Repère la première ligne : elle contient souvent les noms des colonnes (les métadonnées).
- Chaque ligne suivante est une donnée.
- Les virgules séparent les valeurs.
Pour lire un fichier JSON
- Ouvre le fichier avec un éditeur de texte.
- Repère les accolades
{}qui délimitent un objet. - Chaque objet a des paires
"clé": valeur. - Les crochets
[]indiquent une liste d'objets.
Pour trier des données
- Si tu utilises un tableur (comme Excel ou Google Sheets), sélectionne la colonne et clique sur « Trier ».
- Si tu programmes, tu peux utiliser une fonction de tri (par exemple
sort()en Python).
Pour filtrer des données
- Dans un tableur, utilise l'outil « Filtre » pour n'afficher que les lignes qui respectent une condition.
- En programmation, tu peux utiliser une boucle ou une fonction comme
filter().
Exemple corrigé
Énoncé : On a un fichier CSV eleves.csv avec le contenu suivant :
nom,age,ville
Alice,15,Paris
Bob,16,Lyon
Charlie,15,Marseille
Diana,16,Paris
- Quelle est la métadonnée de ce fichier ?
- Donne un exemple de donnée brute.
- Donne un exemple d'information à partir de ces données.
- Trie les élèves par âge croissant.
- Filtre les élèves qui habitent à Paris.
Correction :
- La métadonnée est la première ligne :
nom,age,ville. Elle décrit le contenu des colonnes. - Une donnée brute : « 15 » (l'âge d'Alice).
- Information : « Alice a 15 ans et habite à Paris. »
- Tri par âge croissant : Alice (15), Charlie (15), Bob (16), Diana (16).
- Filtre sur Paris : Alice et Diana.
Erreurs fréquentes
- Confondre donnée et information : une donnée seule n'est pas une information. Exemple : « 15 » n'est pas une information tant qu'on ne sait pas ce que ça mesure.
- Oublier que la première ligne d'un CSV est une métadonnée : beaucoup d'élèves pensent que c'est une donnée comme les autres.
- Mal interpréter le JSON : ne pas confondre les accolades
{}(objet) et les crochets[](liste). - Trier sans préciser l'ordre : toujours dire si c'est croissant ou décroissant.
- Filtrer en supprimant les lignes : le filtre ne supprime pas, il cache temporairement.
À retenir
- Une donnée est brute, une information est contextualisée.
- Les métadonnées sont des données sur les données.
- Les formats CSV et JSON servent à stocker des données structurées.
- Trier = ordonner ; Filtrer = sélectionner selon un critère.
- L'open data rend les données accessibles à tous.
Pour s'entraîner
Maintenant que tu as compris les bases, entraîne-toi avec les exercices et quiz disponibles sur AlloSeconde. Tu pourras manipuler des fichiers CSV et JSON, trier et filtrer des données, et découvrir d'autres exemples concrets d'open data. Bon courage !
