Comparer deux séries statistiques
Ce qu'il faut comprendre
Quand tu as deux séries de données (par exemple les notes de deux classes à un même contrôle), tu veux souvent savoir laquelle est meilleure, ou plus homogène. Comparer deux séries statistiques, c’est utiliser des indicateurs (moyenne, médiane, quartiles, effectifs, fréquences) et des graphiques pour répondre à des questions comme :
- Quelle série a les valeurs les plus élevées en moyenne ?
- Dans quelle série les valeurs sont-elles plus dispersées (plus étalées) ?
- Y a-t-il des valeurs extrêmes dans une série ?
On ne se contente pas de regarder les nombres bruts : on calcule des résumés et on les compare.
Les notions essentielles
Effectif et fréquence
- Effectif : nombre d’individus dans une catégorie ou dans toute la série.
- Fréquence = effectif de la catégorie / effectif total. Elle peut être exprimée en fraction, en nombre décimal ou en pourcentage.
- Quand on compare deux séries de tailles différentes, on utilise plutôt les fréquences (ou les pourcentages) que les effectifs bruts.
Moyenne
- Moyenne = somme de toutes les valeurs divisée par l’effectif total.
- On la note souvent ( \bar{x} ).
- Pour comparer, on calcule la moyenne de chaque série et on regarde laquelle est la plus grande.
Médiane et quartiles
- Médiane : valeur qui partage la série ordonnée en deux parties de même effectif (50 % des valeurs en dessous, 50 % au-dessus).
- Premier quartile (Q1) : valeur telle qu’au moins 25 % des valeurs sont inférieures ou égales à Q1.
- Troisième quartile (Q3) : valeur telle qu’au moins 75 % des valeurs sont inférieures ou égales à Q3.
- Écart interquartile = Q3 – Q1. Il mesure la dispersion autour de la médiane.
- Comparer les médianes permet de voir quelle série a tendance à avoir des valeurs plus élevées (si la médiane est plus grande).
Dispersion
- La dispersion indique si les valeurs sont regroupées ou étalées.
- On peut la mesurer avec l’écart interquartile ou l’étendue (max – min).
- Une série avec un petit écart interquartile est plus homogène qu’une série avec un grand écart interquartile.
Graphiques
- Diagramme en boîte (boîte à moustaches) : il représente la médiane, les quartiles et les valeurs extrêmes. Très utile pour comparer visuellement deux séries.
- Histogramme ou diagramme en bâtons : permet de voir la répartition des effectifs ou des fréquences.
- Quand on compare, on peut superposer deux diagrammes ou les placer côte à côte.
Méthode
Pour comparer deux séries statistiques, suis ces étapes :
- Recueille les données des deux séries.
- Calcule les effectifs et fréquences si nécessaire (surtout si les séries n’ont pas la même taille).
- Calcule la moyenne de chaque série. Compare-les.
- Ordonne chaque série (du plus petit au plus grand).
- Détermine la médiane de chaque série. Compare-les.
- Calcule les quartiles (Q1 et Q3) et l’écart interquartile de chaque série. Compare la dispersion.
- Représente les données avec un diagramme en boîte pour chaque série (sur le même axe si possible).
- Interprète : quelle série a la moyenne/médiane la plus élevée ? La dispersion est-elle plus forte dans une série ? Y a-t-il des valeurs aberrantes ?
Exemple corrigé
Énoncé : Voici les notes (sur 20) de deux groupes d’élèves à un contrôle :
- Groupe A : 8, 12, 14, 15, 16, 18, 19
- Groupe B : 5, 10, 11, 12, 13, 14, 20
Compare ces deux séries.
Correction :
-
Effectifs : les deux groupes ont 7 élèves. On peut comparer directement les effectifs.
-
Moyenne :
- Groupe A : (8+12+14+15+16+18+19)/7 = 102/7 ≈ 14,57
- Groupe B : (5+10+11+12+13+14+20)/7 = 85/7 ≈ 12,14 → La moyenne du groupe A est plus élevée.
-
Médiane :
- Groupe A ordonné : 8, 12, 14, 15, 16, 18, 19 → médiane = 4e valeur = 15
- Groupe B ordonné : 5, 10, 11, 12, 13, 14, 20 → médiane = 4e valeur = 12 → La médiane du groupe A est plus élevée.
-
Quartiles :
- Groupe A : Q1 = 2e valeur = 12 (car 7/4=1,75, on prend la 2e), Q3 = 6e valeur = 18, écart interquartile = 18-12 = 6
- Groupe B : Q1 = 2e valeur = 10, Q3 = 6e valeur = 14, écart interquartile = 14-10 = 4 → Le groupe A a un écart interquartile plus grand, donc ses notes sont plus dispersées autour de la médiane.
-
Graphique : on peut tracer deux boîtes à moustaches côte à côte (non représenté ici, mais imagine).
Interprétation : Le groupe A a de meilleures notes en moyenne et en médiane, mais ses notes sont plus dispersées. Le groupe B est plus homogène, mais a des notes globalement plus faibles.
Erreurs fréquentes
- Confondre effectif et fréquence : quand les séries n’ont pas la même taille, comparer les effectifs bruts peut être trompeur. Utilise les fréquences.
- Oublier d’ordonner les données avant de chercher la médiane ou les quartiles.
- Croire que la moyenne résume tout : une moyenne peut être tirée vers le haut par une valeur très élevée. Toujours regarder aussi la médiane.
- Mal interpréter la dispersion : un grand écart interquartile ne signifie pas que la série est « mauvaise », mais qu’elle est hétérogène.
- Négliger les graphiques : un diagramme en boîte donne une vision rapide et claire.
À retenir
- Pour comparer deux séries, calcule moyenne, médiane, quartiles et écart interquartile.
- Utilise les fréquences si les effectifs totaux sont différents.
- Représente les séries avec des diagrammes en boîte pour visualiser la tendance centrale et la dispersion.
- La moyenne et la médiane indiquent le niveau général ; l’écart interquartile indique l’homogénéité.
Pour s’entraîner
Tu veux vérifier que tu as compris ? Rends-toi sur AlloSeconde, rubrique « Statistiques descriptives », pour faire des exercices interactifs et des quiz. Tu trouveras aussi des fiches de révision et des vidéos. Bon courage !
