Le modèle de régression linéaire simple
Problème : estimer les paramètres du modèle
yi=a+bxi+ei
Hypothèses : La méthode des MCO consiste à minimiser la somme des carrés des aléas A partir des conditions du premier ordre on obtient les paramètres estimés :
Les estimateurs des MCO sont BLUE (Best Linear Unbiaised Estimator) et convergents :
Sous l'hypothèse de normalité des aléas, les estimateurs des MCO sont des estimateurs du maximum de vraisemblance. Soit f la fonction de densité de la loi normale, le logarithme de la fonction de vraisemblance s’écrit : Méthode du maximum de vraisemblance conduit à choisir les estimateurs de a et b tels que la fonction LogL est maximale ou bien tels que la somme des carrés des aléas est minimisée.
La droite de régression de l’échantillon est
donnée par
La qualité de l’ajustement est mesurée par le
coefficient de corrélation (r2 x,y)entre la variable
expliquée et la variable explicative. Il est identique au coefficient de
détermination (R2) donné par le rapport entre la variance de
Un R2 égal à 0,9 signifie que 90% des variations de la variable endogène sont expliquées par le modèle. Les estimateurs
des MCO sont distribués selon un loi normale.
Cependant, afin d’effectuer des
tests statistiques il faut estimer la variance des aléas. Un estimateur non
biaisé de
et la distribution statistique de la
variance estimée des aléas est une loi du Chi-deux : Ainsi il est possible de calculer la variance estimée des paramètres
et la
distribution des statistiques Le test de significativité des paramètres consiste alors à tester l’hypothèse nulle d’égalité à 0 de chaque paramètre successivement. L’hypothèse est acceptée lorsque la valeur du paramètre estimé rapportée à son écart-type est inférieure en valeur absolue à la statistique de student pour un seuil de risque donné a.
C
Pour donner un
intervalle de confiance de la prévision de la variable y, pour une valeur x0
de x donnée, il faut déterminer l'espérance et la variance de l’erreur de prévision notée e0 , L’espérance de l’erreur de prévision est nulle et sa variance est donnée par :
La statistique
avec :
C
On peut également donner un
intervalle de confiance de E(y/x=x0). Dans ce cas, la statistique
l’intervalle de confiance de E(y/x=x0), pour un niveau de risque a, est donné par :
avec :
|