Début du texte
Pour calculer l’étendue, il suffit de trouver la plus grande valeur observée d’une variable (le maximum) et de lui soustraire la plus petite valeur observée (le minimum). L’étendue ne tient compte que de ces deux valeurs et ignore les points de données entre les deux extrémités de la distribution. Elle sert de supplément à d’autres mesures, mais elle est rarement utilisée comme seule mesure de dispersion étant donné qu’elle est sensible aux valeurs extrêmes.
L’écart interquartile et l’écart semi-interquartile donnent une idée plus juste de la dispersion des données. Pour calculer ces deux mesures, il faut d’abord identifier les quartiles. Le quartile inférieur, ou premier quartile (Q1), est la valeur au-dessous de laquelle se trouvent 25 % des données lorsqu’elles sont arrangées en ordre croissant. Le quartile supérieur, ou troisième quartile (Q3), est la valeur au-dessous de laquelle se trouvent 75 % des données arrangées en ordre croissant. La médiane est considérée comme le second quartile (Q2). L’écart interquartile est la différence entre le quartile supérieur et le quartile inférieur. L’écart semi-interquartile est la moitié de l’écart interquartile.
Lorsque le jeu de données est petit, il est simple de trouver les valeurs des quartiles. Regardons un exemple.
Exemple 1 – Étendue et écart interquartile d’un ensemble de données
Identifiez les quartiles de l’ensemble de données suivant : 6, 47, 49, 15, 43, 41, 7, 39, 43, 41, 36.
Pour commencer, vous devez arranger les valeurs en ordre croissant. Ce faisant, vous pouvez donner un rang aux points de données. Le point correspondant à la plus petite valeur aura le rang 1, le point correspondant à la seconde plus petite valeur aura le rang 2 et ainsi de suite.
Tableau 4.5.1.1
Rang des points de données
Sommaire du tableau
Le tableau montre les résultats de Rang des points de données. Les données sont présentées selon Rang (titres de rangée) et Valeur(figurant comme en-tête de colonne).
Rang Valeur 1 6 2 7 3 15 4 36 5 39 6 41 7 41 8 43 9 43 10 47 11 49
Il vous faut ensuite trouver le rang de la médiane. Comme vu à la section sur la médiane, lorsque le nombre de points est impair, la médiane correspond à la valeur du point de rang
(n + 1) ÷ 2 = (11 + 1) ÷ 2 = 6
La médiane est le point de données de rang 6. Il y a donc 5 valeurs de chaque côté.
Vous devez séparer la moitié inférieure à la médiane en 2. Le quartile inférieur sera donc la valeur du point de rang (5 +1) ÷2 = 3, ce qui donne Q1=15. La moitié supérieure à la médiane est également séparée en 2. Le quartile supérieur sera la valeur du point de rang 6 + 3 =9, ce qui donne Q3 = 43.
Une fois les quartiles trouvés, il est facile de mesurer la dispersion. L’écart interquartile est Q3 – Q1, ce qui donne 28 (43-15). L’écart semi-interquartile est 14 (28 ÷ 2) et l’étendue est de 43 (49-6).
Pour les ensembles de données plus grands, il est possible d’utiliser la distribution de fréquence relative cumulée pour aider à identifier les quartiles ou, encore mieux, les fonctions statistiques de base disponibles dans les tableurs et logiciels statistiques qui donnent des résultats plus aisément.
Que se passe-t-il lorsque l’ensemble de données contient un point dont la valeur est extrême par rapport au reste de la distribution?
Exemple 2 – Étendue et écart interquartile en présente d’une valeur extrême
Trouvez l’étendue et l’écart interquartile de l’ensemble de données de l’exemple 1, auquel un point de données de valeur égale à 75 est ajouté.
L’étendue sera de 69 (75-6). La médiane correspondra à la moyenne entre la valeur du point de rang n ÷ 2 = 12 ÷ 2 = 6 et celle du point de rang (n ÷ 2) + 1 = (12 ÷ 2) + 1 =7. Elle tombe donc entre le sixième et le septième rang et il y a six valeurs de chaque côté.
Le quartile inférieur sera la moyenne de la valeur du point de rang 6 ÷2 = 3 et la valeur du point de rang (6 ÷ 2) + 1 = 4. Il est donc égal à (15 + 36) ÷2 = 25,5. Le quartile supérieur sera la moyenne de la valeur du point de rang 6 + 3 = 9 et de la valeur du point de range 6 + 4 = 10, soit (43 + 47) ÷ 2 = 45. L’écart interquartile est de 45 – 25,5 = 19,5.
En résumé, l’étendue est passée de 43 à 69, une augmentation de 26 par rapport à l’exemple 1, à cause d’une seule valeur extrême. L’écart interquartile, plus robuste, est passé de 28 à 19,5, soit une diminution de 8,5 seulement.
Cet exemple permet de démontrer que l’écart interquartile est plus robuste que l’étendue lorsque l’ensemble de données contient une valeur jugée extrême. Ce n’est toutefois pas une mesure parfaite. En effet, on aurait pu s’attendre à ce que la mesure de dispersion soit un peu plus élevée en ajoutant une valeur extrême, mais le contraire s’est produit parce qu’il y avait un écart important entre les valeurs des points de rangs 3 et 4.
La série des cinq valeurs constituées du minimum, des trois quartiles et du maximum est désignée comme « le résumé en cinq nombres ». C’est une manière bien connue de résumer un ensemble de données. Dans la prochaine section sur la boîte à moustaches, nous verrons une méthode pratique pour visualiser le résumé en cinq nombres.
premier quartile d’une série statistique ordonnée est la valeur qui sépare cette série en deux groupes :
• Le premier groupe contient un quart des effectifs (25 %)
• Le deuxième groupe contient trois quarts des effectifs (75 %)
Le troisième quartile d’une série statistique ordonnée est la valeur qui sépare cette série en deux groupes :
• Le premier groupe contient trois quarts des effectifs (75 %)
• Le deuxième groupe contient un quart des effectifs (25 %)
Remarque : La médiane d’une série statistique correspond au deuxième quartile, les deux premiers quarts étant égaux à la moitié (50%).
Exemple 1 : Dans la classe de 25 élèves précédente, on a réécrit le nombre de frères et sœurs de chacun des élèves dans l’ordre croissant :
1
Un quart des valeurs est au dessous de la 7ème valeur et trois quarts se situent au dessus. Par conséquent, la 7ème valeur correspond au
premier quartile
de cette série.
Le premier quartile est donc de 1 frère ou sœur.
2
Un quart des valeurs est au dessus de la 19ème valeur et trois quarts se situent au dessous. Par conséquent la 19ème valeur correspond au
troisième quartile
de cette série.
Le troisième quartile est donc de 2 frères ou sœurs.
Exemple 2 : Approche graphique des quartiles et de la médiane
Dans cette même classe de 25 élèves, on note la taille des élèves dans un tableau en les regroupant par classe :
Taille en cm [0;150[ [150;160[ [160;170[ [170;180[ [180;190[ Effectifs 0 3 11 8 3 Fréquences en pourcentage (%) 0 12 44 32 12 Fréquences cumulées (%) 0 12 56 88 100
Ce tableau signifie que :
0 % des élèves mesurent moins de 150 cm
12 % des élèves mesurent moins de 160 cm
56 % des élèves mesurent moins de 170 cm
88 % des élèves mesurent moins de 180 cm
100 % des élèves mesurent moins de 190 cm
On trace un graphique de fréquences cumulées en plaçant les points de coordonnées : (0;150) ; (12;160) ; (56;170) ; (88;180) ; (12;100). Puis on relie par des segments ces différents points :
Ainsi, on peut lire graphiquement une valeur approchée de la médiane (50 %) , du premier quartile (25 %) et du troisième quartile (75 %) :
• le
premier quartile
est aux environs de 163 cm.
• la
médiane
est aux environs de 169 cm.
• le
troisième quartile
est aux environs de 176 cm.
Led’une série statistique ordonnée est la valeur qui sépare cette série en deux groupes :• Le premier groupe contient un quart des effectifs (25 %)• Le deuxième groupe contient trois quarts des effectifs (75 %)Led’une série statistique ordonnée est la valeur qui sépare cette série en deux groupes :• Le premier groupe contient trois quarts des effectifs (75 %)• Le deuxième groupe contient un quart des effectifs (25 %)Lad’une série statistique correspond au, les deux premiers quarts étant égaux à la moitié (50%).Dans la classe de 25 élèves précédente, on a réécrit le nombre de frères et sœurs de chacun des élèves dans l’ordre croissant :Un quart des valeurs est au dessous de laet trois quarts se situent au dessus. Par conséquent, la 7valeur correspond aude cette série.Le premier quartile est donc de 1 frère ou sœur.Un quart des valeurs est au dessus de la 19valeur et trois quarts se situent au dessous. Par conséquent lacorrespond aude cette série.Le troisième quartile est donc de 2 frères ou sœursApproche graphique des quartiles et de la médianeDans cette même classe de 25 élèves, on note la taille des élèves dans un tableau en les regroupant par classe :Ce tableau signifie que :0 % des élèves mesurent moins de 150 cm12 % des élèves mesurent moins de 160 cm56 % des élèves mesurent moins de 170 cm88 % des élèves mesurent moins de 180 cm100 % des élèves mesurent moins de 190 cmOn trace un graphique de fréquences cumulées en plaçant les points de coordonnées : (0;150) ; (12;160) ; (56;170) ; (88;180) ; (12;100). Puis on relie par des segments ces différents points :Ainsi, on peut lire graphiquement unede la médiane (50 %) , du premier quartile (25 %) et du troisième quartile (75 %) :• leest aux environs de 163 cm.• laest aux environs de 169 cm.• leest aux environs de 176 cm.
Bonjour.
J’ai besoin de calculer la moyenne de la moyenne et l’écart type des écarts types d’un échantillon de 15 personnes. Chaque personne a effectué une marche normale sur tapis et nous avons mesuré la longueur de pas pendant quelques minutes. Chaque personne des 15 participants a une moyenne et un écart type de sa longueur de pas. J’ai besoin de calculer la moyenne de tous les longueurs de pas de tous les participants ainsi que l’écart type de tous les écarts types des 15 participants. Comment je peux faire ceci, svp ? Merci de votre aide !
Bouton qui renvoie à la page de connexion
•
Bouton qui renvoie à la page de connexion
( 1 vote )
Dans cette fiche explicative, nous allons apprendre comment déterminer et interpréter l’écart-type d’une série statistique donnée.
Avant de d’explorer la notion d’écart-type, un rappel de la définition de la moyenne d’une série statistique s’impose.
Définition : La moyenne d’une série statistique
La moyenne d’une série statistique, ou espérance, est utilisée comme indicateur de tendance centrale. Soit une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥}, comprenant 𝑛 valeurs ; on calcule sa moyenne, notée 𝜇 (prononcé « mu ») ou 𝑥, en divisant la somme de toutes les valeurs de la série par le nombre de valeurs 𝑛 qu’elle contient ; on a donc la formule suivante : 𝜇=𝑥+𝑥+𝑥+⋯+𝑥𝑛=∑𝑥𝑛.
L’écart-type d’une série statistique nous renseigne sur la dispersion autour de la moyenne des valeurs de cette série. Plus l’écart-type est grand, plus les valeurs sont dispersées autour de la moyenne ; plus l’écart-type est petit, plus les valeurs sont concentrées autour de la moyenne.
Le carré de l’écart-type est la variance ; la variance est aussi un indicateur de dispersion. Un autre indicateur de dispersion est l’écart interquartile, il s’agit de la différence entre le troisième et le premier quartile, c’est-à-dire la valeur du 75e centile moins celle du 25e centile. Dans cette fiche explicative, nous nous concentrerons uniquement sur l’écart-type comme indicateur de dispersion.
Nous donnons une définition plus formelle de l’écart-type ci-dessous.
Définition : L’écart-type d’une série statistique
On utilise l’écart-type d’une série statistique pour mesurer la dispersion des valeurs de la série autour de sa moyenne. Soit une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥}, comprenant 𝑛 valeurs, on calcule son écart-type, 𝜎 (prononcé « sigma 𝑥 »), en prenant la racine carrée du quotient de la somme des carrés des différences de chaque valeurs de la série statistique et de la moyenne 𝜇 par le nombre de valeurs de cette série, comme indiqué dans la formule ci-dessous : 𝜎=(𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)𝑛=∑(𝑥−𝜇)𝑛.
On peut aussi considérer l’écart-type comme la distance moyenne entre la moyenne de la série statistique et chacun des points correspondants aux valeurs de cette série. Ainsi, plus l’écart-type est grand, plus la distance moyenne entre la moyenne et chacun des points correspondants aux valeurs de cette série est importante, ce qui signifie que les points sont très dispersés. De même, plus l’écart-type est petit, moins la distance moyenne entre la moyenne et chacun des points correspondants aux valeurs de cette série est importante, ce qui signifie qu’ils sont moins dispersés.
Pour traiter le premier exemple, nous utiliserons la définition de l’écart-type d’une série statistique.
Exemple 1: Comprendre l’écart-type
Comment appelle-t-on une quantité permettant d’exprimer à quel point les valeurs d’un groupe diffèrent de la valeur moyenne du groupe ?
Réponse
On sait que l’écart-type d’une série statistique mesure la dispersion de la série autour de sa moyenne. On peut reformuler en disant que l’écart-type mesure à quel point les valeurs d’une série statistique diffèrent de la moyenne de la série.
Par conséquent, la quantité permettant d’exprimer à quel point les valeurs d’un groupe diffèrent de la valeur moyenne du groupe est l’écart-type. Un écart-type faible nous indique qu’en moyenne, les points de données sont proches de la moyenne et un écart-type élevé nous indique qu’en moyenne, les points de données sont éloignés de la moyenne.
Après avoir utilisé la définition de l’écart-type, nous examinerons ensuite le cas où la mesure de la dispersion est nulle, comme indiqué dans l’exemple suivant.
Exemple 2: Identifier un ensemble de valeurs dont la dispersion est nulle
Si la dispersion d’une série statistique est nulle, laquelle des affirmations suivantes est vraie ?
- L’écart entre les différentes valeurs est important.
- L’écart entre les différentes valeurs est faible.
- Toutes les valeurs sont égales.
- La moyenne arithmétique des valeurs est égale à zéro.
- Toutes les valeurs sont négatives.
Réponse
Pour mesurer la dispersion d’une série statistique, on peut utiliser l’écart-type, noté 𝜎. On calcule l’écart-type d’une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥}, comprenant 𝑛 valeurs et dont la moyenne est 𝜇, à l’aide de la formule suivante : 𝜎=(𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)𝑛.
Si la dispersion d’une série statistique est nulle, son écart-type est lui aussi nul. En considérant la formule de l’écart-type égale à zéro, on a alors 𝜎=(𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)𝑛=0.
On élève ensuite au carré les deux membres et on obtient (𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)𝑛=0(𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)𝑛=0.
Puis on multiplie chacun des membres par 𝑛, on a alors (𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)=0×𝑛(𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)=0.
On sait que le carré d’un nombre positif est un nombre positif. Par ailleurs, le carré d’un nombre négatif est lui aussi un nombre positif. Par conséquent, pour que notre somme soit nulle, chacun de ses termes doit être nul : (𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)=0.=0=0=0=0
Ainsi, chaque terme entre parenthèses est égal à zéro, ce qui nous donne 𝑥−𝜇=0,𝑥−𝜇=0,𝑥−𝜇=0,⋯𝑥−𝜇=0.
On résout pour calculer chacune des valeurs 𝑥,𝑥,𝑥,…,𝑥 et on obtient 𝑥=𝜇,𝑥=𝜇,𝑥=𝜇,⋯𝑥=𝜇.
On constate que tous les membres de la série statistique 𝑋 sont égaux à la moyenne 𝜇 et sont donc égaux entre eux, ce qui correspond à la proposition C.
Dans l’exemple suivant, nous utiliserons la formule de l’écart-type d’une série statistique pour déterminer son écart-type connaissant la somme des carrés des différences et le nombre de valeurs de cette série.
Exemple 3: Calculer l’écart-type
Si 𝑥−𝑥 est égale à 25 pour un ensemble de 6 valeurs, déterminez l’écart-type de cet ensemble et arrondissez votre réponse au millième.
Réponse
Pour calculer l’écart-type d’une série statistique, on rappelle la formule 𝜎=∑𝑥−𝑥𝑛, où 𝜎 désigne l’écart-type de la série statistique 𝑋, avec 𝑋={𝑥,𝑥,𝑥,…,𝑥}, 𝑛 est le nombre de valeurs de cette série et 𝑥 est la moyenne des valeurs de la série.
On a 𝑥−𝑥=25, ce qui revient à dire que 𝑥−𝑥=25. Il est aussi précisé que la série statistique comporte 6 valeurs, ce qui indique que 𝑛=6.
En substituant 𝑥−𝑥=25 et 𝑛=6 puis en résolvant pour calculer 𝜎, on obtient 𝜎=∑𝑥−𝑥𝑛=256=2,041241…≈2,041.
Par conséquent, notre réponse arrondie au millième près est 2,041.
Dans la suite, nous verrons comment déterminer l’écart-type d’une série statistique. Nous examinerons cela en détail ci-dessous.
Lors du calcul de l’écart-type d’une série statistique, nous devons suivre un certain nombre d’étapes lorsque nous travaillons avec la formule. Commençons par rappeler la formule, 𝜎=(𝑥−𝜇)+(𝑥−𝜇)+(𝑥−𝜇)+⋯+(𝑥−𝜇)𝑛=∑(𝑥−𝜇)𝑛, où 𝜎 désigne l’écart-type de la série statistique 𝑋, avec 𝑋={𝑥,𝑥,𝑥,…,𝑥}, 𝑛 est le nombre de valeurs de cette série et 𝜇 est la moyenne de cette série.
Pour vous montrer comment utiliser la formule, nous utiliserons la série statistique suivante : 𝑋={1,1,3,5,7}.
Nous allons ensuite suivre les étapes suivantes en utilisant cette série statistique pour illustrer le fonctionnement de chaque étape.
Étape 1 : Calculer la moyenne
Comme nous devons calculer la différence entre la moyenne et les valeurs de la série située dans les parenthèses de la formule, nous devons commencer par calculer la moyenne. On la calcule en utilisant la formule 𝜇=𝑥+𝑥+𝑥+⋯+𝑥𝑛=∑𝑥𝑛, où 𝜇 désigne la moyenne, 𝑋={𝑥+𝑥+𝑥+⋯+𝑥} est la série statistique et 𝑛 est le nombre de valeurs de cette série.
Pour la série statistique, 𝑋={1;1;3;5;7} cela nous donne 𝜇=𝑥+𝑥+𝑥+⋯+𝑥𝑛=1+1+3+5+75=175=3,4.
Étape 2 : Calculer les différences entre chaque valeur et la moyenne
Pour calculer (𝑥−𝜇) dans la formule, nous devons calculer 𝑥−𝜇 pour toutes les valeurs de 𝑖=1,…,𝑛, ou, en d’autres termes, la différence entre la moyenne et chacun des points de données. Pour cette étape et les étapes suivantes, il est utile de ranger cela dans un tableau.
𝑥𝑥−𝜇11−3,4=−2,411−3,4=−2,433−3,4=−0,455−3,4=1,677−3,4=3,6
Étape 3 : Calculer la somme des carrés des différences entre chaque valeur et la moyenne
Pour faire suite à l’étape 2, afin de calculer (𝑥−𝜇) dans la formule de l’écart-type, nous devons ensuite calculer (𝑥−𝜇) pour toutes les valeurs de 𝑖=1,…,𝑛 et en calculer la somme. Autrement dit, on doit élever au carré les différences entre chaque valeur de la série et la moyenne, puis en faire la somme. On va reprendre notre tableau de l’étape 2 et on va lui ajouter une nouvelle colonne.
𝑥𝑥−𝜇(𝑥−𝜇)11−3,4=−2,4(−2,4)=5,7611−3,4=−2,4(−2,4)=5,7633−3,4=−0,4(−0,4)=0,1655−3,4=1,6(1,6)=2,5677−3,4=3,6(3,6)=12,96
En additionnant les valeurs de la dernière colonne, on obtient (𝑥−𝜇)=5,76+5,76+0,16+2,56+12,96=27,2.
Étape 4 : Substituer dans la formule et déterminer l’écart-type
Pour la dernière étape, nous substituons la somme des carrés et 𝑛 dans la formule, puis on calcule la valeur de l’écart-type.
À partir de l’étape 3, nous avons trouvé (𝑥−𝜇)=27,2 et on sait que 𝑛=5. Par conséquent, en substituant dans la formule de 𝜎 on obtient 𝜎=∑(𝑥−𝜇)𝑛=27,25=√5,44=2,3323…≈2,33 qui est l’écart-type de la série statistique 𝑋={1;1;3;5;7}.
Nous pouvons résumer ces étapes comme suit.
Comment : Déterminer l’écart-type d’une série statistique
Étape 1 : Calculer la moyenne de la série
Étape 2 : Calculer les différences entre chaque valeur de la série et la moyenne
Étape 3 : Calculer la somme des carrés des différences entre chaque valeur et la moyenne
Étape 4 : Substituer la somme des carrés et 𝑛 dans la formule puis prendre la racine carrée pour calculer l’écart-type (ce résultat doit toujours être positif).
Dans l’exemple suivant, nous utiliserons cette méthode pour calculer l’écart-type d’une série statistique.
Exemple 4: Calculer l’écart-type d’une série statistique
Calculez l’écart-type des valeurs 45, 35, 42, 49, 39 et 34. Donnez votre réponse au millième près.
Réponse
Pour calculer l’écart-type d’une série statistique, on utilise la formule 𝜎=∑(𝑥−𝜇)𝑛, où 𝜎 désigne l’écart-type de la série statistique 𝑋, avec 𝑋={𝑥,𝑥,𝑥,…,𝑥}, 𝑛 est le nombre de valeurs dans cette série et 𝜇 est la moyenne de cette série.
On commence par calculer la moyenne de la série statistique, 𝜇. On rappelle que la formule de la moyenne est 𝜇=𝑥+𝑥+𝑥+⋯+𝑥𝑛.
Dans notre cas, la série statistique 𝑋 est {45;35;42;49;39;34} et elle comprend un total de 6 valeurs. On peut donc substituer {45;35;42;49;39;34} à {𝑥,𝑥,𝑥,…,𝑥} et 6 à 𝑛, on obtient alors 𝜇=45+35+42+49+39+346=2446=40,6.
Puis on calcule 𝑥−𝜇 pour chacune des valeurs de notre série statistique. Pour nous aider, nous allons ranger les données dans un tableau comme suit :
𝑥𝑥−𝜇4545−40,6=4,33535−40,6=−5,64242−40,6=1,34949−40,6=8,33939−40,6=−1,63434−40,6=−6,6
Nous pouvons à présent calculer (𝑥−𝜇). Pour cela, on élève au carré 𝑥−𝜇 pour chacune des valeurs de la série, puis on additionne toutes les données. Nous ajouterons une autre colonne au tableau ci-dessus pour faciliter le calcul.
𝑥𝑥−𝜇(𝑥−𝜇)4545−40,6=4,3(4,3)=18,73535−40,6=−5,6(−5,6)=32,14242−40,6=1,3(1,3)=1,74949−40,6=8,3(8,3)=69,43939−40,6=−1,6(−1,6)=2,73434−40,6=−6,6(−6,6)=44,4
Quand on additionne (𝑥−𝜇) pour chaque membre de la série statistique, on obtient (𝑥−𝜇)=18,7+32,1+1,7+69,4+2,7+44,4=169,3.
On peut à présent substituer (𝑥−𝜇)=169,3 et 𝑛=6 dans la formule initiale de l’écart-type, puis calculer 𝜎 : 𝜎=∑(𝑥−𝜇)𝑛=169,36=√28,2≈5,312459….
Arrondi au millième, notre résultat est 5,312.
Par conséquent, l’écart-type de notre série statistique est 5,312 arrondi au millième.
Dans l’exemple suivant, nous chercherons en utilisant l’écart-type, laquelle des séries statistiques parmi les trois proposées a la plus grande dispersion.
Exemple 5: Identifier la série statistique possédant le plus grand écart-type
En calculant l’écart-type, déterminez laquelle des séries {−17;20;6;−13}, {−5;−16;5;9} et {−1;−6;20;−1} a la plus grande dispersion.
Réponse
Pour calculer l’écart-type de chacune de ces séries statistiques, on utilise la formule 𝜎=∑(𝑥−𝜇)𝑛, où 𝜎 désigne l’écart-type de la série statistique 𝑋 où 𝑋={𝑥,𝑥,𝑥,…,𝑥}, 𝑛 est le nombre de valeurs de cette série et 𝜇 est la moyenne de cette série.
On observe que chacune de nos séries est constituée de quatre valeurs, donc 𝑛 vaut 4 dans chaque cas.
Nous allons d’abord déterminer l’écart-type de chaque série statistique, puis les comparer pour déterminer lequel a la plus grande dispersion.
Pour {−17;20;6;−13}, nous devons tout d’abord calculer la moyenne 𝜇 de la série statistique. On rappelle que la formule de la moyenne est 𝜇=𝑥+𝑥+𝑥+⋯+𝑥𝑛.
On peut donc substituer {−17;20;6;−13} à {𝑥,𝑥,𝑥,𝑥} et 4 à 𝑛, on obtient alors 𝜇=−17+20+6+(−13)4=−44=−1.
On va ensuite calculer 𝑥−𝜇 pour chacune des valeurs de la série statistique. Nous nous aiderons pour cela d’un tableau dans lequel nous rangerons nos résultats :
𝑥𝑥−𝜇−17−17−(−1)=−162020−(−1)=2166−(−1)=7−13−13−(−1)=−12
Nous pouvons à présent calculer (𝑥−𝜇). Pour cela, on élève au carré 𝑥−𝜇 pour chacune des valeurs de la série statistique, puis on additionne toutes les données. Nous ajouterons une autre colonne au tableau ci-dessus pour faciliter le calcul.
𝑥𝑥−𝜇(𝑥−𝜇)−17−17−(−1)=−16(−16)=2562020−(−1)=21(21)=44166−(−1)=7(7)=49−13−13−(−1)=−12(−12)=144
Quand on additionne (𝑥−𝜇) pour chaque membre de la série statistique, on obtient (𝑥−𝜇)=256+441+49+144=890.
On peut à présent substituer (𝑥−𝜇)=890 et 𝑛=4 dans la formule initiale de l’écart-type, puis calculer 𝜎 : 𝜎=∑(𝑥−𝜇)𝑛=8904=√222,5=14,9164….
Nous allons maintenant réitérer ces étapes pour les deux autres séries statistiques.
La moyenne de la série {−5;−16;5;9} est 𝜇=𝑥+𝑥+𝑥+⋯+𝑥𝑛=−5+(−16)+5+94=−74=−1,75.
Pour calculer (𝑥−𝜇), on calcule 𝑥−𝜇 et (𝑥−𝜇) pour chaque valeur de la série statistique. Comme précédemment, nous nous aiderons d’un tableau dans lequel nous rangerons nos résultats :
𝑥𝑥−𝜇(𝑥−𝜇)−5−5−(−1,75)=−3,25(−3,25)=10,5625−16−16−(−1,75)=−14,25(−14,25)=203,062555−(−1,75)=6,75(6,75)=45,562599−(−1,75)=10,75(10,75)=115,5625
On additionne chaque valeur (𝑥−𝜇) de la série statistique et on obtient (𝑥−𝜇)=10,5625+203,0625+45,5625+115,5625=374,75.
En substituant (𝑥−𝜇)=374,75 et 𝑛=4 dans la formule initiale de l’écart-type, on calcule 𝜎, on obtient 𝜎=∑(𝑥−𝜇)𝑛=374,754=√93,6875=9,6792….
La moyenne de la dernière série statistique, {−1;−6;20;−1}, est 𝜇=𝑥+𝑥+𝑥+⋯+𝑥𝑛=−1+(−6)+20+(−1)4=124=3.
Pour calculer (𝑥−𝜇), on calcule d’abord 𝑥−𝜇 et (𝑥−𝜇) pour chaque valeur de la série statistique. Comme précédemment, nous nous aidons d’un tableau dans lequel nous rangerons nos résultats :
𝑥𝑥−𝜇(𝑥−𝜇)−1−1−3=−4(−4)=16−6−6−3=−9(−9)=812020−3=17(17)=289−1−1−3=−4(−4)=16
En faisant la somme des (𝑥−𝜇) pour chaque valeur de la série statistique, on obtient (𝑥−𝜇)=16+81+289+16=402.
En substituant (𝑥−𝜇)=402 et 𝑛=4 dans la formule initiale de l’écart-type, on peut calculer 𝜎, on obtient 𝜎=∑(𝑥−𝜇)𝑛=4024=√100,5=10,0249….
Nous avons à présent trouvé l’écart-type de chacune de nos trois séries statistiques. Résumons ceci ci-dessous :
- Pour
{−17;20;6;−13},
𝜎=14,91 arrondi au centième.
- Pour
{−5;−16;5;9},
𝜎=9,68 arrondi au centième.
- Pour
{−1;−6;20;−1},
𝜎=10,02 arrondi au centième.
En comparant ces trois valeurs, on constate que la première série statistique, {−17;20;6;−13}, a le plus grand écart-type.
L’écart-type étant un indicateur de dispersion, on peut conclure que {−17;20;6;−13} a la dispersion la plus grande des trois séries.
Jusqu’ici, les séries statistiques dont nous avons déterminé les écart-types nous étaient données sous forme de liste de valeurs. Nous allons maintenant apprendre à calculer l’écart-type de séries données sous forme de tableau des effectifs.
Pour calculer l’écart-type d’une série statistique donnée sous forme de tableau des effectifs, on doit prendre en compte les valeurs et leur effectif. Pour cela, on pourrait choisir de lister toutes les valeurs de la série. Prenons par exemple la série statistique suivante :
𝑥𝑒314753
On pourrait dire qu’elle se compose d’un 3, de sept 4 et de trois 5 ou l’écrire 3;4;4;4;4;4;4;4;5;5;5 de manière à calculer son écart type, comme évoqué précédemment. Cette approche n’est cependant pas adaptée si certaines valeurs ont un grand effectif (par exemple 100, ou même 1 000) ; en effet, dans de tels cas, on devrait écrire une très longue liste. De ce fait, il est plus efficace de calculer les carrés des différences avec la moyenne dans chaque série statistique, puis de la multiplier par l’effectif correspondant (à peu près de la même manière que nous calculerions la moyenne pondérée d’une série statistique dans un tableau des effectifs).
Avant de nous pencher sur la formule et la méthode à appliquer pour calculer l’écart-type d’une série statistique donnée sous la forme d’un tableau des effectifs, commençons par rappeler comment calculer sa moyenne.
Définition : La moyenne pondérée d’une série statistique présentée dans un tableau des effectifs
Soit une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥} dont les effectifs sont 𝐸={𝑒,𝑒,𝑒,…,𝑒} et le nombre de valeurs distinctes est 𝑛, on calcule sa moyenne 𝜇 en utilisant la formule suivante : 𝜇=𝑥𝑒+𝑥𝑒+𝑥𝑒+⋯+𝑥𝑒𝑒+𝑒+𝑒+⋯+𝑒=∑𝑥𝑒∑𝑒.
Une autre façon de représenter cela est dans un tableau avec les valeurs de la série statistique dans la première colonne, les effectifs correspondants dans la deuxième colonne, le produit de la valeur par son effectif dans la troisième colonne et les sommes dans la dernière ligne du tableau. On obtient alors la moyenne pondérée en divisant la somme de la troisième colonne par la somme de la deuxième colonne.
𝑥𝑒𝑥𝑒𝑥𝑒𝑥𝑒𝑥𝑒𝑥𝑒𝑥𝑒𝑥𝑒⋯⋯⋯𝑥𝑒𝑥𝑒𝑒𝑥𝑒
Après avoir rappelé la moyenne pondérée d’une série statistique dans un tableau des effectifs, nous allons maintenant nous intéresser à l’écart-type. On donne sa formule ci-dessous.
Définition : L’écart-type d’une série statistique présentée dans un tableau des effectifs
Soit une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥} dont les effectifs correspondants sont 𝐸={𝑒,𝑒,𝑒,…,𝑒}, avec 𝑛 le nombre de valeurs distinctes et 𝜇 la moyenne, on calcule son écart-type 𝜎 en utilisant la formule suivante : 𝜎=(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+⋯+(𝑥−𝜇)×𝑒𝑒+𝑒+𝑒+⋯+𝑒=∑(𝑥−𝜇)𝑒∑𝑒.
L’approche utilisée pour calculer l’écart-type d’une série statistique donnée sous la forme d’un tableau des effectifs est en général similaire à celle employée dans le cas d’une série dont on nous donne la liste des valeurs, il existe cependant quelques différences notables. Comme on travaille avec des effectifs, on doit multiplier chacune des valeurs distinctes de la série par son effectif pour calculer la moyenne. De même, lorsqu’on calcule la somme des carrés des différences entre chaque valeur distincte et la moyenne, on doit multiplier par l’effectif correspondant.
Dans le prochain exemple, nous verrons comment calculer l’écart-type d’une série statistique présentée dans un tableau des effectifs.
Exemple 6: Déterminer l’écart-type d’une série statistique
Le tableau ci-dessous présente la répartition des buts marqués lors de la première moitié d’une saison de football.
Nombre de buts01346Nombre de matchs52774
Calculez l’écart-type du nombre de buts marqués. Donnez votre réponse au millième près.
Réponse
Comme les données présentées dans cette question sont sous la forme d’un tableau des effectifs, pour calculer l’écart-type 𝜎, on utilise la formule 𝜎=(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+⋯+(𝑥−𝜇)×𝑒𝑒+𝑒+𝑒+⋯+𝑒=∑(𝑥−𝜇)𝑒∑𝑒, où 𝑋={𝑥,𝑥,𝑥,…,𝑥} représente les valeurs de la série avec leur effectif correspondant dans 𝐸={𝑒,𝑒,𝑒,…,𝑒}, il y a 𝑛 valeurs distinctes pour cette série et 𝜇 représente la moyenne.
Dans cet exemple, les valeurs de la série sont le nombre de buts marqués lors de la première moitié d’une saison de football. Le nombre de matchs correspond à l’effectif pour lequel chacun de ces buts a été marqué. Réécrivons cela en utilisant 𝑥 et 𝑒 en tant qu’étiquettes du tableau et en transposant le tableau, comme suit :
𝑥𝑒0512374764
Pour calculer l’écart-type, on doit d’abord calculer la moyenne pondérée 𝜇. Pour calculer la moyenne pondérée d’une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥} dont les effectifs sont 𝐸={𝑒,𝑒,𝑒,…,𝑒} et le nombre de valeurs distinctes est 𝑛, on utilise la formule suivante : 𝜇=𝑥𝑒+𝑥𝑒+𝑥𝑒+⋯+𝑥𝑒𝑒+𝑒+𝑒+⋯+𝑒=∑𝑥𝑒∑𝑒.
En utilisant le tableau ci-dessus, nous pouvons ajouter une nouvelle colonne pour calculer 𝑥𝑒 pour chaque valeur de 𝑖 puis l’utiliser pour calculer la moyenne.
𝑥𝑒𝑥𝑒050×5=0121×2=2373×7=21474×7=28646×4=24
En additionnant les valeurs 𝑥𝑒 et en divisant par la somme des effectifs on obtient 𝜇=𝑥𝑒+𝑥𝑒+𝑥𝑒+⋯+𝑥𝑒𝑒+𝑒+𝑒+⋯+𝑒=0+2+21+28+245+2+7+7+4=7525=3.
On va maintenant calculer la différence entre chaque valeur de la série statistique et la moyenne, puis les carrés de ces différences afin de calculer la somme des carrés. Pour cela, on ajoute deux nouvelles colonnes au tableau.
𝑥𝑒𝑥𝑒𝑥−𝜇(𝑥−𝜇)050×5=00−3=−3(−3)=9121×2=21−3=−2(−2)=4373×7=213−3=00=0474×7=284−3=11=1646×4=246−3=33=9
Nous devons maintenant calculer le produit des carrés des différences entre la moyenne et les valeurs de la série par les effectifs correspondants aux valeurs de la série statistique. Nous allons ajouter une autre colonne au tableau pour ce faire.
𝑥𝑒𝑥𝑒𝑥−𝜇(𝑥−𝜇)(𝑥−𝜇)𝑒050×5=00−3=−3(−3)=99×5=45121×2=21−3=−2(−2)=44×2=8373×7=213−3=00=00×7=0474×7=284−3=11=11×7=7646×4=246−3=33=99×4=36
Nous avons à présent tout ce qu’il nous faut pour calculer l’écart-type. On substitue les valeurs du tableau dans la formule de l’écart-type et on calcule 𝜎 : 𝜎=(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+⋯+(𝑥−𝜇)×𝑒𝑒+𝑒+𝑒+⋯+𝑒=45+8+0+7+365+2+7+7+4=9625=√3,84=1,95959…≈1,960 soit 1,960 au millième près.
Par conséquent, l’écart-type du nombre de buts marqués est 1,960 au millième près.
Voyons maintenant comment calculer l’écart-type de données regroupées par classes en utilisant les centres de ces classes. Cette approche entraine les mêmes étapes que pour les tableaux des effectifs, mais nous avons à faire à des intervalles pour notre série statistique au lieu d’avoir un ensemble de valeurs ; ainsi, nous devons utiliser le centre pour donner une approximation des valeurs de la série. Nous donnons les détails dans le prochain et dernier exemple.
Exemple 7: Calculer l’écart-type d’une série statistique regroupée par classes
Un groupe de 92 étudiants a passé un examen ; les notes obtenues à cet examen sont présentées dans le tableau des effectifs ci-dessous. Calculez l’écart-type au centième près.
Note0<𝑠⩽2020<𝑠⩽4040<𝑠⩽6060<𝑠⩽8080<𝑠⩽100Effectif261024527
Réponse
Comme les données présentées dans cette question sont sous la forme d’un tableau des effectifs, afin de calculer l’écart-type 𝜎, on utilise la formule 𝜎=(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+⋯+(𝑥−𝜇)×𝑒𝑒+𝑒+𝑒+⋯+𝑒=∑(𝑥−𝜇)𝑒∑𝑒, où 𝑋={𝑥,𝑥,𝑥,…,𝑥} représente les valeurs de la série statistique avec les effectifs correspondants 𝐸={𝑒,𝑒,𝑒,…,𝑒}, il y a 𝑛 valeurs distinctes dans cette série statistique et la moyenne est représentée par 𝜇.
Dans ce type de problème, on ne nous donne pas des valeurs exactes, mais différentes « classes » de valeurs représentées par des intervalles. Cela signifie que nous ne pouvons pas appliquer directement la formule ci-dessus, car nous ne pouvons pas substituer ces intervalles aux valeurs de 𝑥 dans notre formule.
Au lieu de cela, l’approche que nous devons adopter est de déterminer le « centre » de chaque intervalle afin de l’utiliser pour représenter la valeur correspondante de 𝑥. Après cela, nous pourrons traiter le problème comme avec n’importe quelle autre tableau des effectifs.
Pour trouver le centre d’une classe, on additionne ses bornes inférieure et supérieure et on divise par 2. On pourra ainsi déduire une valeur approchée de l’écart-type de notre série statistique.
Ainsi, les valeurs de la série statistique sont le centre de chacune des classes de notes obtenues lors du questionnaire et les effectifs correspondants sont les effectifs de chaque valeur. On commence donc par trouver le centre de chaque intervalle ; pour cela, on trace un tableau dans lequel les 𝑥 sont nos centres et les 𝑒 nos effectifs :
IntervalleCentre 𝑥Effectif 𝑒0<𝑠⩽200+202=102620<𝑠⩽4020+402=301040<𝑠⩽6040+602=502460<𝑠⩽8060+802=70580<𝑠⩽10080+1002=9027
Pour calculer l’écart-type, on doit dans un premier temps calculer la moyenne, 𝜇. Pour une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥} avec comme effectifs correspondants 𝐸={𝑒,𝑒,𝑒,…,𝑒} et 𝑛 valeurs distinctes de la série statistique, nous utilisons la formule suivante : 𝜇=𝑥𝑒+𝑥𝑒+𝑥𝑒+⋯+𝑥𝑒𝑒+𝑒+𝑒+⋯+𝑒=∑𝑥𝑒∑𝑒.
On rappelle à nouveau qu’on utilise les centres de chaque classe pour représenter les valeurs de 𝑥. On reprend notre tableau et on lui ajoute une nouvelle colonne dans laquelle on calcule 𝑥𝑒 pour chaque valeur de 𝑖, afin de calculer la moyenne.
IntervalleCentre 𝑥Effectif 𝑒𝑥𝑒0<𝑠⩽200+202=102610×26=26020<𝑠⩽4020+402=301030×10=30040<𝑠⩽6040+602=502450×24=120060<𝑠⩽8060+802=70570×5=35080<𝑠⩽10080+1002=902790×27=2430
On fait la somme des 𝑥𝑒 et on divise par la somme des effectifs, on obtient 𝜇=𝑥𝑒+𝑥𝑒+𝑥𝑒+⋯+𝑥𝑒𝑒+𝑒+𝑒+⋯+𝑒=260+300+1200+350+243026+10+24+5+27=454092≈49,34782….
Ensuite, nous allons calculer la différence entre les centres de chaque classe de notre série statistique et la moyenne, puis le carré de celle-ci afin de calculer la somme des carrés. Pour cela, on ajoute deux nouvelles colonnes à notre tableau. On notera que toutes les valeurs sont arrondies à 4 chiffres après la virgule.
IntervalleCentre 𝑥Effectif 𝑒𝑥𝑒𝑥−𝜇(𝑥−𝜇)0<𝑠⩽200+202=102610×26=26010−49,3478=−39,3478
1 548
,
2 494
20<𝑠⩽4020+402=301030×10=30030−49,3478=−19,3478
374
,
3 375
40<𝑠⩽6040+602=502450×24=120050−49,3478=0,6522
,
4 254
60<𝑠⩽8060+802=70570×5=35070−49,3478=20,6522
426
,
5 134
80<𝑠⩽10080+1002=902790×27=243090−49,3478=40,6522
1 652
,
6 014
On doit à présent, pour chaque ligne, multiplier le carré de la différence entre le centre de la classe et la moyenne par l’effectif correspondant. On note ces résultats dans une nouvelle colonne que l’on ajoute au tableau. On arrondit à nouveau toutes les valeurs à 4 chiffres après la virgule.
IntervalleCentre 𝑥Effectif 𝑒𝑥𝑒𝑥−𝜇(𝑥−𝜇)(𝑥−𝜇)𝑒0<𝑠⩽200+202=102610×26=26010−49,3478
=−39,3478
1 548
,
24 936
40 254
,
4 818
20<𝑠⩽4020+402=301030×10=30030−49,3478
=−19,3478
374
,
337 365
3 743
,
3 736
40<𝑠⩽6040+602=502450×24=120050−49,3478
=0,6522
,
42 536 484
10
,
2 088
60<𝑠⩽8060+802=70570×5=35070−49,3478
=20,6522
426
,
513 365
2 132
,
5 668
80<𝑠⩽10080+1002=902790×27=243090−49,3478
=40,6522
1 652
,
60 136
44 620
,
2 351
Nous avons à présent tout ce qu’il nous faut pour calculer l’écart-type. Nous allons substituer les valeurs du tableau dans la formule de l’écart-type et calculer 𝜎 : 𝜎=(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+(𝑥−𝜇)×𝑒+⋯+(𝑥−𝜇)×𝑒𝑒+𝑒+𝑒+⋯+𝑒=40254,4818+3743,3736+10,2088+2132,5668+44620,235126+10+24+5+27=90760,866192=√986,5311…=31,4091…, soit 31,41 au centième près.
Par conséquent, l’écart-type est 31,41 au centième près.
Dans cette fiche explicative, nous avons découvert la notion d’écart-type et nous avons appris à calculer l’écart-type d’une série statistique présentée sous les deux formes, une liste de valeurs et un tableau des effectifs. Nous avons également appris à comparer des séries statistiques et à tirer des conclusions en utilisant l’écart-type.
Points clés
- On utilise l’écart-type d’une série statistique pour mesurer la dispersion des données autour de la moyenne.
- Pour les données présentées dans une liste, la formule pour l’écart-type 𝜎 d’une série statistique 𝑋={𝑥,𝑥,𝑥,…,𝑥} à 𝑛 valeurs et dont la moyenne est 𝜇 est 𝜎=∑(𝑥−𝜇)𝑛.
- Pour les données présentées dans un tableau des effectifs, la formule de l’écart-type 𝜎 d’une série statistique
𝑋={𝑥,𝑥,𝑥,…,𝑥},
dont les effectifs correspondants sont
𝐸={𝑒,𝑒,𝑒,…,𝑒},
𝑛 est le nombre de valeurs distinctes dans la série de données et la moyenne est
𝜇,
est 𝜎=∑(𝑥−𝜇)𝑒∑𝑒.
- Pour les tableaux des effectifs regroupés en classes, avec les données sous forme d’intervalles, on utilise le centre de chaque intervalle pour représenter les valeurs de
𝑥.
https://www.youtube.com/watch?v=
Soyez le premier a laisser un commentaire