Format CSV
Ce qu'il faut comprendre
Quand tu travailles avec des données, il faut les stocker dans un fichier pour pouvoir les réutiliser. Le format CSV (Comma-Separated Values, c'est-à-dire « valeurs séparées par des virgules ») est un format très simple et très utilisé pour échanger des données entre différents logiciels (tableur, base de données, programme).
Imagine un tableau avec des lignes et des colonnes : chaque ligne correspond à un enregistrement (par exemple, un élève), et chaque colonne à une propriété (nom, prénom, note). Le CSV permet de représenter ce tableau dans un fichier texte, où chaque ligne du fichier est une ligne du tableau, et les valeurs des colonnes sont séparées par un caractère (souvent une virgule ou un point-virgule).
Les notions essentielles
- Donnée : une information brute (exemple : « 15 », « Paris », « 2024-03-01 »).
- Métadonnée : une donnée qui décrit d'autres données. Par exemple, le nom des colonnes (en-tête) dans un fichier CSV est une métadonnée : il indique ce que représentent les valeurs.
- Table : une structure organisée en lignes et colonnes. Chaque ligne est un enregistrement, chaque colonne un champ.
- CSV : format de fichier texte où les valeurs sont séparées par un séparateur (virgule, point-virgule, tabulation). La première ligne contient souvent les en-têtes (métadonnées).
- JSON : un autre format structuré pour les données, plus riche que CSV (il permet des objets imbriqués). On le rencontre souvent dans les API web.
- Tri : action de réordonner les lignes d'une table selon une colonne (ordre alphabétique, numérique, etc.).
- Filtre : action de ne garder que les lignes qui satisfont une condition (exemple : notes > 10).
- Open data : données ouvertes, mises à disposition gratuitement par des organismes (État, collectivités) pour que tout le monde puisse les utiliser. Les fichiers CSV sont très courants en open data.
Méthode
- Reconnaître un fichier CSV : il a l'extension
.csvet peut être ouvert avec un éditeur de texte (Bloc-notes) ou un tableur (LibreOffice Calc, Excel). - Lire un CSV : ouvre-le avec un tableur : les colonnes sont automatiquement séparées. Vérifie le séparateur (souvent virgule ou point-virgule).
- Créer un CSV : dans un tableur, saisis tes données, puis « Enregistrer sous » → choisir « CSV (séparateur : virgule) ».
- Trier : dans un tableur, sélectionne la colonne de tri, puis « Trier » (croissant ou décroissant).
- Filtrer : active le filtre automatique (souvent un bouton « Filtrer ») : des flèches apparaissent dans les en-têtes, tu peux choisir les valeurs à afficher.
- Comparer CSV et JSON : CSV est plus simple, plat ; JSON permet des structures hiérarchiques (exemple : une personne avec une adresse qui contient rue, ville, code postal).
Exemple corrigé
Énoncé : Tu as le fichier CSV suivant (les notes d'une classe) :
Nom;Prénom;Note
Martin;Sophie;14
Durand;Léo;8
Petit;Emma;16
- Quelle est la métadonnée ?
- Combien y a-t-il de lignes de données ?
- Trie les élèves par note décroissante.
- Filtre pour n'afficher que les élèves ayant une note >= 10.
Correction :
- La métadonnée est la première ligne : « Nom;Prénom;Note ». Elle décrit le contenu des colonnes.
- Il y a 3 lignes de données (les lignes 2, 3, 4).
- Après tri décroissant sur la colonne Note :
- Petit Emma 16
- Martin Sophie 14
- Durand Léo 8
- Après filtre (Note >= 10) :
- Martin Sophie 14
- Petit Emma 16
Erreurs fréquentes
- Confondre donnée et métadonnée : la métadonnée est l'en-tête, pas les valeurs.
- Oublier le séparateur : si tu ouvres un CSV avec un tableur et que tout est dans une seule colonne, c'est que le séparateur n'est pas reconnu. Essaie de changer le séparateur lors de l'import.
- Penser que CSV est le seul format : non, JSON est aussi très utilisé, surtout sur le web.
- Modifier un CSV avec un éditeur de texte sans faire attention aux virgules : si une valeur contient une virgule, il faut la mettre entre guillemets (exemple : "Paris, France").
À retenir
- CSV = format simple pour stocker des données tabulaires.
- Première ligne = métadonnées (en-têtes).
- On peut trier et filtrer facilement avec un tableur.
- CSV est souvent utilisé en open data.
- JSON est un autre format, plus structuré.
Pour s'entraîner
Pour vérifier que tu as bien compris, rends-toi sur AlloSeconde : tu y trouveras des exercices interactifs sur le format CSV, des quiz et des fiches de révision. Entraîne-toi à créer, trier et filtrer des fichiers CSV !
