Effectifs, fréquences et pourcentages
Ce qu'il faut comprendre
Quand tu fais une enquête ou que tu observes des données (par exemple les notes de ta classe, les sports préférés de tes amis, ou les tailles des élèves), tu as besoin de les organiser pour y voir plus clair. Les effectifs, les fréquences et les pourcentages sont les outils de base pour décrire une série statistique. Ils te permettent de répondre à des questions comme : « Combien d'élèves ont eu 12 ? », « Quelle proportion de la classe fait du foot ? » ou « Quel pourcentage de notes est au-dessus de 10 ? ».
Ces notions sont le point de départ de toute analyse statistique. Elles t'aident à résumer l'information, à la comparer et à la présenter simplement, par exemple avec un tableau ou un graphique.
Les notions essentielles
Effectif
L'effectif d'une valeur (ou d'une classe) est le nombre de fois que cette valeur apparaît dans la série. On le note souvent $n_i$ pour la valeur $x_i$.
- Effectif total : c'est la somme de tous les effectifs, notée $N$. Il correspond au nombre total d'individus dans la série.
Fréquence
La fréquence d'une valeur est le quotient de son effectif par l'effectif total. Elle s'exprime souvent en fraction ou en nombre décimal.
$$f_i = \frac{n_i}{N}$$
La somme des fréquences est toujours égale à 1.
Pourcentage
Le pourcentage est une fréquence multipliée par 100 :
$$p_i = f_i \times 100 = \frac{n_i}{N} \times 100$$
Il exprime la proportion en « pour cent ».
Moyenne
La moyenne d'une série est la somme de toutes les valeurs divisée par l'effectif total. Si les valeurs sont $x_1, x_2, ..., x_N$, alors :
$$\bar{x} = \frac{x_1 + x_2 + ... + x_N}{N}$$
Si les données sont regroupées (avec des effectifs), on utilise :
$$\bar{x} = \frac{n_1 x_1 + n_2 x_2 + ... + n_k x_k}{N}$$
Médiane
La médiane est la valeur qui partage la série ordonnée en deux parties de même effectif. Pour une série de $N$ valeurs rangées par ordre croissant :
- Si $N$ est impair, la médiane est la valeur de rang $\frac{N+1}{2}$.
- Si $N$ est pair, la médiane est la moyenne des valeurs de rang $\frac{N}{2}$ et $\frac{N}{2}+1$.
Quartiles
Les quartiles partagent la série ordonnée en quatre parties égales :
- Q1 (premier quartile) : valeur du rang $\frac{N}{4}$ (arrondi à l'entier supérieur si nécessaire).
- Q3 (troisième quartile) : valeur du rang $\frac{3N}{4}$ (arrondi à l'entier supérieur).
L'écart interquartile $Q3 - Q1$ mesure la dispersion autour de la médiane.
Dispersion
La dispersion indique comment les valeurs sont réparties. On peut la décrire par :
- L'étendue : $\text{max} - \text{min}$.
- L'écart interquartile : $Q3 - Q1$.
- Les valeurs extrêmes (minimum et maximum).
Graphiques
Pour visualiser les données, on utilise souvent :
- Diagramme en bâtons : pour des valeurs discrètes (ex : notes).
- Histogramme : pour des classes continues (ex : tailles).
- Diagramme circulaire : pour des proportions (fréquences ou pourcentages).
Méthode
- Recueillir les données : liste brute.
- Organiser : trier et compter les effectifs (tableau).
- Calculer les fréquences : diviser chaque effectif par l'effectif total.
- Calculer les pourcentages : multiplier les fréquences par 100.
- Calculer la moyenne : somme des valeurs (ou somme des produits effectif × valeur) divisée par $N$.
- Déterminer la médiane : ordonner la série, appliquer la règle selon $N$.
- Trouver les quartiles : utiliser les rangs $N/4$ et $3N/4$.
- Calculer l'écart interquartile : $Q3 - Q1$.
- Représenter graphiquement : choisir le type adapté.
Exemple corrigé
Énoncé : Voici les notes obtenues par 20 élèves à un contrôle : 8, 12, 15, 10, 8, 14, 12, 10, 9, 11, 13, 12, 10, 8, 15, 11, 9, 12, 10, 14.
-
Organiser les données :
- Notes : 8, 9, 10, 11, 12, 13, 14, 15.
- Effectifs : 8 (3 fois), 9 (2), 10 (4), 11 (2), 12 (4), 13 (1), 14 (2), 15 (2).
- Effectif total $N = 20$.
-
Fréquences et pourcentages :
- Note 8 : $f = 3/20 = 0,15$ ; $p = 15%$.
- Note 9 : $f = 2/20 = 0,10$ ; $p = 10%$.
- Note 10 : $f = 4/20 = 0,20$ ; $p = 20%$.
- Note 11 : $f = 2/20 = 0,10$ ; $p = 10%$.
- Note 12 : $f = 4/20 = 0,20$ ; $p = 20%$.
- Note 13 : $f = 1/20 = 0,05$ ; $p = 5%$.
- Note 14 : $f = 2/20 = 0,10$ ; $p = 10%$.
- Note 15 : $f = 2/20 = 0,10$ ; $p = 10%$.
-
Moyenne : $$\bar{x} = \frac{3\times8 + 2\times9 + 4\times10 + 2\times11 + 4\times12 + 1\times13 + 2\times14 + 2\times15}{20} = \frac{24+18+40+22+48+13+28+30}{20} = \frac{223}{20} = 11,15$$
-
Médiane : $N=20$ (pair), rangs 10 et 11. Série ordonnée : 8,8,8,9,9,10,10,10,10,11,11,12,12,12,12,13,14,14,15,15. Les 10e et 11e valeurs sont 11 et 11, donc médiane = 11.
-
Quartiles :
- Q1 : rang $20/4 = 5$ → 5e valeur = 9.
- Q3 : rang $3\times20/4 = 15$ → 15e valeur = 12.
- Écart interquartile : $12 - 9 = 3$.
-
Graphique : on peut tracer un diagramme en bâtons des effectifs.
Erreurs fréquentes
- Confondre effectif et fréquence : l'effectif est un nombre, la fréquence est une proportion.
- Oublier de multiplier par 100 pour le pourcentage : $f = 0,15$ donne $15%$, pas $0,15%$.
- Mal ordonner la série pour la médiane : toujours trier d'abord.
- Prendre la valeur du milieu sans vérifier la parité de $N$ : pour $N$ pair, la médiane est la moyenne des deux valeurs centrales.
- Confondre Q1 et Q3 : Q1 est au quart, Q3 aux trois quarts.
- Utiliser un diagramme circulaire pour des données non proportionnelles : il ne convient que pour des parts d'un tout.
À retenir
- Effectif : nombre d'occurrences.
- Fréquence : effectif / total.
- Pourcentage : fréquence × 100.
- Moyenne : somme des valeurs / effectif total.
- Médiane : valeur centrale après tri.
- Quartiles : Q1 (25%), Q3 (75%).
- Dispersion : étendue, écart interquartile.
- Graphiques : bâtons, histogramme, circulaire.
Pour s'entraîner
Maintenant que tu as compris le cours, tu peux t'entraîner avec les exercices et quiz disponibles sur AlloSeconde. Tu y trouveras des séries à analyser, des calculs de moyenne et médiane, et des constructions de graphiques. Bon courage !
