On considère une expérience aléatoire à deux issues. Par convention :
l'une de ces issues est appelée "succès", de probabilité p ;
l'autre est appelé "échec", de probabilité 1-p.
Fluctuation d'échantillonnage et la loi des grands nombres
On a recueilli expérimentalement les fréquence du succès associées à 100 échantillons de taille N pour p = 0,4.
Chaque point représente la fréquence observée dans un échantillon.
N = 500
On constate que les fréquences de succès observées sur plusieurs échantillons de taille fixée fluctent autour de la probabilité p=0,4. C'est ce qu'on appelle la fluctuation d'échantillonnage.
Lorsque la taille N augmente, il semble que cette fluctuation diminue : les fréquences observées deviennent proches de p.
Principe de l'estimation d'une probabilité ou d'une proportion
Estimation d'une probabilité
On considère une expérience aléatoire et un événement A de probabilité inconnue p.
En procédant à des simulations de l'expérience et en considérantles deux issues :
succès : "l'événement A est réalisé".
échec : "l'événement A n'est pas réalisé".
On constitue des échantillons de taille n sur lesquels on peut calculer la fréquence de succès observée f.
D'après la loi des grands nombres, sauf exception, lorsque la taille n de l'échantillon est grande, la fréquence f est proche de la probabilité p.
Estimation d'une proportion
On s'intéresse à une population P composée d'individus susceptibles de revêtir ou non un caractère donné.
Choisir successivement et de façon indépendante n individus dans cette population revient à constituer un échantillon de taille n.
La proportion d'individus présentant le caractère étudié est notée :
p dans l'ensemble de la population,
f dans l'échantillon, que l'on nomme fréquence observée.
D'après la loi des grands nombres, sauf exception, lorsque la taille n de l'échantillon est grande, la fréquence f est très proche de la proportion p.
Précision de l'estimation
Lorsqu'on approche la probabilité ou la proportion p par la fréquence observée f, l'erreur commise est égale à |f-p|.
Cette erreur est, sauf execption, d'autant plus petite que l'échantillon sur lequel est calculée la fréquence f est de taille n grande.
Exemple graphique
On a recueilli expérimentalement les fréquence du succès associées à 100 échantillons de taille N pour p = 0,4.
Chaque point rouge représente la fréquence observée dans un échantillon avec une erreur supérieure à \(\cfrac{1}{\sqrt{N}}\).