logo du site mathtecsup
Cours de Mathématiques Exercices

Lycée BTS Classes Supérieures
Vous êtes sur la page : Accueil ---> Statistique inférentielle ---> Approximation d'une loi binomiale par une loi normale

Approximation d'une loi binomiale
par une loi normale

Théorème de la limite centrée et loi faible des grands nombres

Dans le cadre de l'étude de la fréquence de succès d'échantillons de même taille, on constate par simulation, en augmentant la taille des échantillons, que l'écart entre les valeurs prises par la variable aléatoire représentant la fréquence de succès et p devient de plus en plus petit.

En effet, d'après les théorèmes obtenus auparavant, concernant la moyenne d'échantillons de même taille ou la fréquence d'échantillons de même taille, l'écart type de Mn ou de Fn est obtenu en divisant celui des Xi par √n.

Donc plus n est grand, plus les valeurs de Mn ou de Fn se trouvent resserrées autour de m ou de p. Ces observations sont précisées par le théorème suivant admis.

Loi faible des grands nombres

Loi faible des grands nombres

Cela signifie en fait que les valeurs de la variable aléatoire représentant la moyenne de n variables aléatoires indépendantes de même espérance m se rapprochent indéfiniment de m lorsque n devient de plus en plus grand.

Exprimé en termes de probabilités, comme dans la conclusion de ce théorème, cela se traduit par le fait que l'événement "l'écart entre la variable aléatoire représentant la moyenne et m est infiniment petit" devient l'événement certain. Ce théorème porte le nom de loi faible des grands nombres.

Lorsque la variable aléatoire représente la fréquence d'apparition du succès dans un échantillon de taille n, cette loi s'exprime par :

Loi faible des grands nombres

Dans ce cas, la loi faible des grands nombres indique que la fréquence d'apparition du sucès se stabilise autour de la probabilité du succès lorsque le nombre de tirages indépendants devient très grand.

Vous n'aurez jamais à utiliser la loi faible des grands nombres, qu'elle concerne une variable aléatoire représentant une fréquence ou une moyenne de n variables indépendantes, dans un exercice. Cette loi sert simplement à justifier le théorème d'approximation d'une loi de probabilité quelqconque par une loi normale qui va suivre.

Approximation par la loi normale

Reprenons l'étude réalisée lors de l'introduction à la moyenne d'échantillons de même taille. L'expérience consiste cette fois à choisir n objets parmi les 5 objets disponibles et on considère la variable aléatoire qui à chaque échantillon de taille n associe la moyenne des coûts de ces n objets.

Si l'on détermine la loi de probabilité de cette variable aléatoire, et que l'on représente cette loi par un diagramme en bâtons où l'on associe à chaque valeur x de la variable en abscisse la probabilité que cette variable aléatoire prenne la valeur x en ordonnée, on constate que lorsque n devient très grand, les sommets des bâtons semblent se positionner sur une courbe de Gauss : c'est le théorème de la limite centrée qui suit et que l'on admettra.

Théorème de la limite centrée

On utilise généralement cette approximation lorsque n est supérieur à 30, et on dit dans ce cas qu'on se situe dans le cadre de la théorie des grands échantillons.

Ce théorème est le résultat le plus important concernant l'échantillonnage : il sera utilisé chaque fois que l'on aura à traîter d'une situation concernant des échantillons.

Par exemple, considérons un atelier qui produit des disques abrasifs en grande série et notons X la variable aléatoire qui, à chaque disque prélévé au hasard dans la production, associe son diamètre. On suppose que X suit une loi de probabilité d'espérance mathématique, ou encore de moyenne 50 et d'écart type 0,5. On prélève alors au hasard des échantillons non exhaustifs, c'est-à-dire que le tirage ainsi opéré est considéré comme un tirage avec remise, de 36 disques.

On note Y la variable aléatoire qui, à chaque échantillon, associe la moyenne des diamètres des 36 disques. La taille des échantillons est suffisamment grande pour que l'on applique le théorème de la limite centrée, et on peut donc affirmer que Y suit approximativement la loi normale de moyenne 50 et d'écart type 0,5/6, soit encore 1/12.

Conséquence du théorème de la limite centrée

Approximation d'une loi binomiale par une loi normale

Par conséquent, lorsque n sera suffisamment grand, on pourra remplacer une loi binomiale par une loi normale, ce qui simplifiera considérablement les calculs.

Dans la pratique, on se permet d'utiliser cette approximation lorsqu'on a np > 15 et n(1-p) > 15, ces deux conditions étant réunies en même temps. Ces résultats n'ont toutefois pas à être mémorisées : chaque fois qu'une approximation d'une loi binomiale par une loi normale est possible, elle est clairement indiquée dans l'énoncé.

Toutefois, cette approximation doit être effectuée avec certaines précautions car la loi binomiale est une loi discrète alors que la loi normale est une loi liée à une variable aléatoire continue.

Par conséquent, on sait que pour une variable aléatoire continue, des probabilités du type P(X = a) avec a réel sont nulles, ce qui n'est pas le cas pour des lois discrètes.

Pour pallier à ce problème, on utilise alors le procédé appelé correction de continuité.

Correction de continuité

Prenons une variable aléatoire X qui suit la loi binomiale B(50 ; 0,6). X est une variable aléatoire discrète qui prend toutes les valeurs entières comprises entre 0 et 50. On a par exemple :

Exemple de correction de continuité
Exemple de correction de continuité
Exemple de correction de continuité

Alors on doit avoir : P(Y = 30) = 0, ce qui n'est pas le cas pour P(X = 30). Pour éviter ce problème entre P(X = 30) et P(Y = 30), on applique donc la correction de continuité : puisque X ne prend que des valeurs entières, on peut écrire : P(X = 30) = P(29,5 < X < 30,5). On peut alors remplacer X par Y et on obtient :

Exemple de correction de continuité

On voit ainsi que l'approximation de la loi binomiale de paramètres 50 et 0.6 par la loi normale précédente est plutôt fiable puisque les résultats obtenus avec l'une et l'autre des deux lois ne diffèrent qu'à partir de la troisième décimale. En outre, le calcul avec la loi normale est nettement plus aisé qu'avec la formule de la loi binomiale. Cela dit, vous n'aurez pas à décider vous-même des valeurs à utiliser dans l'encadrement de X dans la loi normale pour remplacer la valeur correspondante à la loi binomiale et la probabilité à calculer avec la loi normale servant d'approximation de la loi binomiale sera clairement précisée dans l'énoncé.

Dans le cas de notre exemple, nous avons remplacé p(X = 30) par p(29,5<Y<30,5) mais nous aurions tout à fait pu opter pour p(29,9<Y<30,1), mais quelle que soit l'encadrement choisi, c'est l'énoncé qui vous l'indiquera.

Copyright "Mathtecsup" 2017, tous droits réservés