logo du site mathtecsup
Cours de Mathématiques Exercices

Lycée BTS Classes Supérieures
Vous êtes sur la page : Accueil ---> Statistiques ---> Ajustement affine

Ajustement affine

Comme nous l'avons indiqué lors de la présentation des statistiques à deux variables, l'objectif est d'établir une relation de dépendance mathématique entre les deux variables x et y d'une série statistique, c'est-à-dire une relation du type y = f(x), où f est une fonction dont la représentation graphique est évidemment la plus proche possible du nuage de points représentant la série.

Droite de régression de y en x

Lorsque le nuage de points semble présenter une forme allongée, c'est-à-dire que ses points paraissent sensiblement alignés suivant une direction de droite, cela suggère de trouver une fonction f affine telle que y = f(x). On utilise alors ce qu'on appelle un ajustement affine.

Par conséquent, on essaie de déterminer l'équation de la droite représentant f par une méthode appelée méthode des moindres carrées, car la droite obtenue, parmi toutes les droites possibles pouvant approcher le nuage de points, et celle dont la somme des carrés des distances aux points du nuage est minimale.

Cette droite est appelée droite de régression de y en x. Elle passe par le point moyen de la série. Son coefficient directeur est le quotient de la covariance par le carré de l'écart type de la variable x, c'est-à-dire sa variance.

L'ordonnée à l'origine s'obtient en utilisant le fait que cette droite passe par le point moyen. On retiendra donc le résultat suivant :

droite de régression de y en x

Coefficient de corrélation linéaire

Pour justifier un ajustement affine, on calcule un coefficient particulier appelé coefficient de corrélation linéaire. Ce coefficient est obtenue en effectuant le quotient de la covariance des deux variables x et y par le produit des écart types de chaque variable. Par conséquent :

coefficient de corrélation linéaire

On démontre que ce coefficient est toujours compris entre -1 et 1. Plus la valeur absolue de r est proche de 1, c'est-à-dire plus r est proche de - 1 ou de 1, et plus l'ajustement affine se justifie car la droite de régression de y en x est d'autant plus proche du nuage de points que r est proche de - 1 ou de 1. Si tous les points du nuage de points sont effectivement alignés, ce qui est toutefois rarement le cas, ce coefficient de corrélation linéaire sera exactement égal à 1 ou à -1.

Autre type d'ajustement

Il arrive que le nuage de points ait l'allure non pas d'une droite mais de la courbe représentative d'une fonction de type exponentiel, c'est-à-dire construite à partir de la fonction exponentielle. Dans ce cas, on utilise la méthode précédente avec la série statistique double des variables x et lny, après avoir calculé le logarithme népérien des valeurs de la série des y. Lorsque deux ajustements sont envisageables, pour la série (x ; y) et pour la série (x ; lny), le meilleur sera celui pour lequel le coefficient de corrélation est le plus proche de - 1 ou de 1.

Mise en garde

L'obtention d'un ajustement affine même en cas de forte corrélation n'assure pas toujours une véritable relation de cause à effet d'une grandeur sur une autre. Ces deux grandeurs peuvent par exemple être liées à une même cause non prise en compte par l'étude statistique.

Ainsi, on pourra par exemple trouver une forte corrélation durant la période estivale entre la vente de lunettes de soleil et celle de crème solaire. Mais il serait hasardeux de tenir les achats de lunettes de soleil pour la cause directe de ceux des crèmes solaires et inversement. Une étude statistique ne peut donc se substituer à une preuve scientifique.

Copyright "Mathtecsup" 2017, tous droits réservés