Table de données et enregistrement
Ce qu'il faut comprendre
Tu manipules tous les jours des données structurées, sans forcément t'en rendre compte. Quand tu regardes la liste de tes contacts dans ton téléphone, chaque contact est un enregistrement : il regroupe des informations comme le nom, le numéro, l'adresse mail. L'ensemble de tous tes contacts forme une table de données. Cette organisation permet de retrouver facilement une information, de trier par ordre alphabétique ou de filtrer pour n'afficher que les contacts d'une certaine ville.
Dans le monde professionnel et scientifique, on utilise des tables de données pour stocker et analyser des informations : résultats d'expériences, listes de clients, données météo, etc. Les formats les plus courants sont CSV (Comma-Separated Values) et JSON (JavaScript Object Notation). Ces formats sont lisibles par les humains et par les machines, ce qui permet d'échanger des données facilement.
Les métadonnées sont des données qui décrivent les données elles-mêmes : par exemple, le nom des colonnes, le type de chaque donnée (texte, nombre, date), l'unité de mesure. Elles sont essentielles pour comprendre et utiliser correctement une table.
Enfin, l'open data (données ouvertes) est le mouvement qui encourage la mise à disposition libre et gratuite de données publiques (par exemple, les horaires de bus, les résultats du bac, les budgets des villes). Ces données sont souvent fournies en CSV ou JSON.
Les notions essentielles
- Donnée : information élémentaire (ex : "Jean", 25, "Paris").
- Métadonnée : donnée sur la donnée (ex : "Nom", "Âge", "Ville").
- Table de données : ensemble structuré de données organisé en lignes et colonnes. Chaque colonne correspond à un champ (une propriété), chaque ligne à un enregistrement.
- Enregistrement : une ligne de la table, qui regroupe toutes les informations sur un même objet (ex : une personne, un produit).
- CSV : format texte où les valeurs sont séparées par des virgules (ou points-virgules). Chaque ligne est un enregistrement, la première ligne contient souvent les métadonnées (noms des colonnes).
- JSON : format texte structuré avec des accolades et des crochets. Un enregistrement est un objet entre accolades, avec des paires "clé":"valeur".
- Tri : réorganisation des enregistrements selon l'ordre croissant ou décroissant d'une ou plusieurs colonnes.
- Filtre : sélection des enregistrements qui satisfont une condition (ex : âge > 18).
- Open data : données ouvertes, librement accessibles et réutilisables.
Méthode
Pour travailler avec une table de données, suis ces étapes :
- Identifier les métadonnées : regarde la première ligne (CSV) ou les clés (JSON) pour connaître le nom et le type de chaque champ.
- Comprendre la structure : combien d'enregistrements ? Combien de colonnes ? Chaque ligne représente quoi ?
- Trier : choisis une colonne (ex : nom, date) et décide de l'ordre (alphabétique, numérique, chronologique).
- Filtrer : définis une condition logique (ex : ville = "Lyon", prix <= 10). Ne garde que les lignes qui vérifient la condition.
- Interpréter : que nous apprend la table après tri/filtre ?
Exemple corrigé
Énoncé : On considère la table suivante (format CSV) :
Nom,Âge,Ville
Alice,15,Paris
Bob,17,Lyon
Charlie,16,Marseille
Diana,15,Lyon
- Quelles sont les métadonnées ?
- Combien d'enregistrements ?
- Trie la table par âge croissant.
- Filtre pour n'obtenir que les personnes habitant à Lyon.
Correction :
- Les métadonnées sont les noms des colonnes : "Nom", "Âge", "Ville".
- Il y a 4 enregistrements (lignes 2 à 5).
- Table triée par âge croissant :
Nom,Âge,Ville
Alice,15,Paris
Diana,15,Lyon
Charlie,16,Marseille
Bob,17,Lyon
(On peut aussi trier par ordre alphabétique du nom en cas d'égalité d'âge, mais ici on a deux 15 ans, l'ordre entre Alice et Diana n'est pas imposé.)
- Filtre sur Ville = "Lyon" :
Nom,Âge,Ville
Bob,17,Lyon
Diana,15,Lyon
Erreurs fréquentes
- Confondre donnée et métadonnée : "Nom" est une métadonnée, "Alice" est une donnée.
- Oublier la première ligne dans un CSV : elle contient les métadonnées, pas un enregistrement.
- Mal interpréter un JSON : ne pas confondre un objet (entre accolades) et un tableau (entre crochets).
- Trier sur une colonne sans préciser l'ordre : toujours dire croissant ou décroissant.
- Filtrer avec une condition mal écrite : par exemple, "Ville = Lyon" sans guillemets si c'est du texte.
- Penser que CSV et JSON sont les seuls formats : il en existe d'autres (XML, etc.), mais en Seconde on se concentre sur ceux-ci.
À retenir
- Une table de données est un tableau avec des lignes (enregistrements) et des colonnes (champs).
- Les métadonnées décrivent les données (noms des colonnes).
- CSV : format simple, valeurs séparées par des virgules.
- JSON : format structuré avec accolades et crochets.
- Trier = ordonner les lignes selon une colonne.
- Filtrer = ne garder que les lignes qui respectent une condition.
- Open data = données publiques accessibles à tous.
Pour s'entraîner
Tu peux maintenant tester tes connaissances avec les exercices et quiz interactifs sur AlloSeconde. Tu y trouveras des tables à trier, filtrer, et des questions sur CSV et JSON. Bon courage !
