Le modèle de régression linéaire multiple
Problème : estimer les paramètres
du modèle yi=b1x1i
+ b2x2i + b3x3i +....bKxKi
+ei Sous forme matricielle lorsque le modèle comporte une constante, par exemple si x1i prend la valeur 1 quelque soit i=1,...N, le modèle s'écrit:
La méthode des MCO consiste à minimiser la somme des carrés des aléas
A
partir des conditions du premier ordre on obtient les paramètres estimés :
Les estimateurs des MCO sont BLUE (Best Linear Unbiaised Estimator) et convergents :
Sous l'hypothèse de normalité des aléas, les estimateurs des MCO sont des estimateurs du maximum de vraisemblance. Soit f la fonction de densité de la loi normale, le logarithme de la fonction de vraisemblance s’écrit :
La droite de régression de
l’échantillon est donnée par
La qualité de l’ajustement est mesurée par le
coefficient de détermination (R2) donné par le rapport entre la
variance de
Un R2 égal a 0,9 signifie que 90% des variations de la variable endogène sont expliquées par le modèle.
Le coefficient de détermination augmente de
manière systématique avec le nombre de variables explicatives et pour comparer
la qualité d’ajustement entre deux modèles on utilise le coefficient de
détermination ajusté
L'estimateur des MCO est distribué selon un loi normale,
son
espérance est égale à la
vrai valeur des paramètres B et sa matrice de variance covariance est égale à
s2(X'X)-1.
. Cependant afin d’effectuer des tests
statistiques il faut estimer la variance des aléas. Un estimateur non biaisé
de
et la distribution statistique
de la variance estimée des aléas est une loi du Chi-deux :
Ainsi il est possible d’estimer la matrice de
variance des paramètres :
La distribution de la statistique
Le test de significativité des paramètres
consiste alors à tester l’hypothèse nulle d’égalité à 0 de chaque paramètre
successivement C Pour
donner un intervalle de confiance de la prévision de la variable y, pour une valeur
x0 de x donnée, il faut déterminer l'espérance et la variance de
l’erreur de prévision notée e0 , L’espérance de l’erreur de prévision est nulle et sa variance est donnée par :
La
statistique
avec :
C
On peut également donner un
intervalle de confiance de E(y/x=x0). Dans ce cas, la statistique
l’intervalle de confiance de E(y/x=x0), pour un niveau de risque a, est donné par :
avec :
|