Donner du sens aux données : calculs statistiques
Les calculs statistiques transforment les données brutes en résumés, visualisations et prédictions significatives. De l’organisation des données en tableaux de fréquences et en diagrammes en boîte au calcul des percentiles et des scores z, ces techniques aident les élèves à décrire les tendances, à comparer les ensembles de données et à tirer des conclusions, compétences utilisées dans les sciences, les affaires, l’analyse des données sportives et la prise de décision quotidienne.
Composantes des calculs statistiques
Cette section couvre les outils et techniques statistiques essentiels :
- Tableaux de fréquences et histogrammes : Organisation des données en groupes (classes) pour indiquer la fréquence à laquelle les valeurs se situent dans chaque intervalle.
- Diagrammes en boîte (résumé à cinq volets) : Résumé des données avec le minimum, Q1 (25e percentile), la médiane, Q3 (75e percentile) et le maximum.
- Percentiles et quartiles : Les percentiles divisent les données en 100 parties égales ; les quartiles les divisent en 4. Le 50e percentile est la médiane.
- Scores Z : Mesure du nombre d’écarts types dont une valeur est éloignée de la moyenne : z = (x - moyenne) / écart type.
Exemples de calculs statistiques
Exemples de tableaux de fréquences
- Notes d’examen : 72, 85, 91, 68, 77, 84, 95, 73, 88, 80. Regrouper en classes : 60-69 (1), 70-79 (3), 80-89 (4), 90-99 (2).
- Enquête sur le nombre d’heures d’étude par semaine : 0 à 2 heures (5 étudiants), 3 à 5 heures (12 étudiants), 6 à 8 heures (8 étudiants), 9 heures et plus (3 étudiants).
- Lancer un dé 30 fois et enregistrer les résultats dans un tableau de fréquences permet de comparer les fréquences observées à la fréquence attendue de 5 par face.
Exemples de diagrammes en boîte
- Données : 2, 5, 7, 8, 12, 14, 18, 20, 25. Minimum = 2, Q1 = 7, médiane = 12, Q3 = 18, maximum = 25.
- Les notes d’examen de deux classes sont affichées sous forme de diagrammes en boîte côte à côte. La boîte de la classe A est étroite (petit IQR, notes cohérentes), tandis que la boîte de la classe B est large (grand IQR, notes variables).
- Un diagramme en boîte révèle les valeurs aberrantes : toute valeur inférieure de plus de 1,5 × IQR à Q1 ou supérieure de plus de 1,5 × IQR à Q3 est signalée. Si Q1 = 20 et Q3 = 40, IQR = 20, donc toute valeur inférieure à -10 ou supérieure à 70 est une valeur aberrante.
Exemples de percentiles
- Un élève obtient un score au 85e percentile d’un test standardisé, ce qui signifie qu’il a obtenu un score supérieur à celui de 85 % des participants au test.
- Dans un ensemble de données de 50 valeurs triées par ordre, Q1 (25e percentile) est approximativement la 13e valeur et Q3 (75e percentile) est approximativement la 38e valeur.
- Un bébé au 60e percentile pour le poids est plus lourd que 60 % des bébés du même âge.
Exemples de scores Z
- Un test a une moyenne de 75 et un écart type de 10. Un score de 90 a un score Z de (90 - 75) / 10 = 1,5, ce qui signifie 1,5 écart type au-dessus de la moyenne.
- Un score de 60 au même test a un score Z de (60 - 75) / 10 = -1,5, ce qui signifie 1,5 écart type en dessous de la moyenne.
- Comparer les scores de deux tests différents : l’élève A a obtenu un score de 85 à un test dont la moyenne est de 80 et l’écart type de 5 (score Z = 1,0). L’élève B a obtenu un score de 92 à un test dont la moyenne est de 85 et l’écart type de 10 (score Z = 0,7). L’élève A a obtenu de meilleurs résultats, malgré un score brut plus faible.