JanTemp: Température en
janvier moyennée sur 30 ans (1931-1960)
Lat: Latitude en degrés nord de l'équateur
Long: Longitude en degrés ouest du premier méridien
On se propose de prédire la température en fonction
des autres variables.
1/ Lire les données sous R et construire le modèle
comme
dans le TP Voitures.
Dans son article, J.L.Peixoto propose une régression polynomiale
avec des termes
croisés d'ordre 1 en Lat et 3 en Long.
2/ Faire les tracés réponses/régresseur.
Commenter
3/ Essayer de trouver un modèle de taille
raisonnable par une anova.
On s'intéressera aux
sous-modèles du modèle d'ordre 2 en Latitude et 3 en Longitude (p=12).
4/ On peut aussi comparer les variances résiduelles des
différents modèles
calculées par validation croisée. On
pourra utiliser cette fonction qui calcule le CV:
cv=function(mod){h=lm.influence(mod)$hat;u=mod$residuals;
resu=mean((u/(1-h))^2);sqrt(resu)}
Si l'on fait une hypothèse optimiste d'indépendance, on a une estimée de
l'écart-type de CV (la variance de la moyenne est la variance individuelle
divisée par le nombre d'individus), qui a quand même
le mérite de donner un ordre de grandeur permettant une comparaison
raisonnable des différents CV:
sv=function(mod){h=lm.influence(mod)$hat;u=mod$residuals;v=(u/(1-h))^2;
v=v-mean(v);
resu=mean(v^2)/length(u);sqrt(resu)}