Statistiques
Indicateur de tendance centrale
La moyenne
Définition
On considère la série statistique \((x_1, n_1)\), \((x_2, n_2)\), ..., \((x_p, n_p)\) où \(x_1, x_2, ...,x_p\) sont les valeurs du caractère étudié et \(n_1, n_2, ...,n_p\) les effectifs associés. Alors la moyenne notée \(\bar{x}\) de cette série est définie par :
\(\bar{x}=\cfrac{n_1x_1+n_2x_2+ ... +n_px_p}{n_1+n_2+ ... +n_p}\)
Exemple
On considère la série suivante :
Valeur 5 8 10 12 16
Effectif 2 4 5 6 1
\(\bar{x}=\cfrac{n_1x_1+n_2x_2+ ... +n_px_p}{n_1+n_2+ ... +n_p}=\cfrac{2\times 5+4\times 8+ 5\times 10+6\times 12+1\times 16}{2+4+5+6+1}=10\)
Avec la numworks
Avec la
Propriété
Soit \(f_1, f_2, ...,f_p\) les fréquences associées aux valeurs \(x_1, x_2, ...,x_p\) de la série statistique. Alors :
\(\bar{x}=f_1x_1+f_2x_2+ ... +f_px_p\)
Exemple
On considère la série suivante :
Valeur 5 9 13 12 14
Fréquence 0,2 0,1 0,3 0,35 0,05
\(\bar{x}=f_1x_1+f_2x_2+ ... +f_px_p=0,2\times 5+0,1\times 9+ 0,3\times 13+0,35\times 12+0,05\times 14=10,7\)
Théorème (linéarité de la moyenne)
On considère une série statistique prenant comme valeurs \(x_1, x_2, ...,x_p\). On note \(\bar{x}\) sa moyenne.
Pour tous réels \(a\) et \(b\) la série statistique prenant les valeurs \(ax_1+b, ax_2+b, ...,ax_p+b\) a pour moyenne \(a\bar{x}+b\).
Exemple
On considère la série précédente. On décide de rajouter 2 à toutes les valeurs
Valeur 7 10 12 14 18
Effectif 2 4 5 6 1
\(\bar{x}=10+2=12\)
Vérification :
\(\bar{x}=\cfrac{n_1x_1+n_2x_2+ ... +n_px_p}{n_1+n_2+ ... +n_p}=\cfrac{2\times 7+4\times 10+ 5\times 12+6\times 14+1\times 18}{2+4+5+6+1}=12\)
La médiane et les quartiles
Définition
La médiane d'une série de N valeurs rangées par ordre croissant est le nombre Me, tel qu'au moins 50% des valeurs de la série lui sont inférieures ou égales et au moins 50% lui sont supérieures ou égales.
Si N est impair , Me est la valeur centrale.
Si N est pair , Me est la demi-somme des deux valeurs centrales.
Définitions
Les valeurs d'une série statistique étant rangées par ordre croissant.
Le premier quartile noté Q1 est la plus petite valeur de la série telle qu'au moins 25% des valeurs de la série sont inférieures ou égales à Q1 .
Le troisième quartile noté Q3 est la plus petite valeur de la série telle qu'au moins 75% des valeurs de la série sont inférieures ou égales à Q3 .
Exemple
Soit la série ordonnée suivante : 0; 0; 0; 1; 2; 2 ; 2; 3; 3; 3; 3 ; 4 ; 4; 4; 4; 5; 6 ; 6; 6; 6; 6; 9.
La médiane : L'effectif total est 22 qui est pair. La 11ème valeur et la 12ème valeur sont les 2 valeurs centrales, d'où la médiane \(Me=\cfrac{3+4}{2}=3,5\); ;
Le premier quartile Q1 : On cherche sa position 22×0,25 = 5,5 (on arrondit toujours à l'entier supérieur) soit 6, Donc Q1 =6ème valeur=2 .
Le troisième quartile Q3 : On cherche sa position 22×0,75 = 16,5 (on arrondit toujours à l'entier supérieur) soit 17, Donc Q3 =17ème valeur=6 .
Avec la numworks
Avec la
Indicateurs de dispersion
Etendue et écart interquartile
Définitions
L'étendue est la différence entre la plus grande et la plus petite valeur d'une série.
L'écart interquartile est la différence Q3 -Q1 entre les troisiéme et premier quartiles.
Exemple
Avec l'exemple précédent
l'étendue est 9 - 0 = 9.
L'écart interquartile est Q3 -Q1 = 6 - 2 = 4.
Ecart-type
Définition
On considère la série statistique \((x_1, n_1)\), \((x_2, n_2)\), ..., \((x_p, n_p)\) où \(x_1, x_2, ...,x_p\) sont les valeurs du caractère étudié et \(n_1, n_2, ...,n_p\) les effectifs associés, et de moyenne \(\bar{x}\). Alors l'écart-type noté \(\sigma\) est défini par :
\(\sigma =\sqrt{\cfrac{n_1(x_1-\bar{x})^2+n_2(x_2-\bar{x})^2+...+n_p(x_p-\bar{x})^2}{n_1+n_2+...+n_p}}\).
Commentaires
L'écart-type mesure la dispersion des valeurs autour de la moyenne; plus il est grand plus les valeurs sont éloignées de la moyenne.
L'écart-type est exprimé dans la même unité que celle du caractère étudié.
Il est souvent intéressant de calculer la proportion de valeurs de la série appartenant à l'intervalle \([\bar{x}-2\sigma ; \bar{x}+2\sigma]\).
L'écart-type est essentiellement calculé à l'aide d'une calculatrice ou d'un ordinateur (par exemple avec un programme en Python)
Exemple
On considère la série suivante :
Valeur 5 8 10 12 16
Effectif 2 4 5 6 1
On a vu précédemment que \(\bar{x}=10\).
\(\sigma =\sqrt{\cfrac{2(5-10)^2+4(8-10)^2+ 5(10-10)^2+6(12-10)^2+1(16-10)^2}{2+4+5+6+1}}=\sqrt{7}=2,64...\)
Avec la numworks
Avec la
Je fais le point sur le cours
Your browser does not support the video tag.
Your browser does not support the video tag.