Températures

Description

Températures moyennes au mois de janvier dans 52 viiles des Etats-Unis. Les variables sont les suivantes:

JanTemp: Température en janvier moyennée sur 30 ans (1931-1960)
Lat: Latitude en degrés nord de l'équateur
Long: Longitude en degrés ouest du premier méridien

On se propose de prédire la température en fonction des autres variables.

Analyse

1/ Lire les données sous R et construire le modèle comme dans le TP Voitures.

Dans son article, J.L.Peixoto propose une régression polynomiale avec des termes
croisés d'ordre 1 en Lat et 3 en Long.

2/ Faire les tracés réponses/régresseur. Commenter

3/ Essayer de trouver un modèle de taille raisonnable par une anova.
On s'intéressera aux sous-modèles du modèle d'ordre 2 en Latitude et 3 en Longitude (p=12).

4/ On peut aussi comparer les variances résiduelles des différents modèles
calculées par validation croisée. On pourra utiliser cette fonction qui calcule le CV:

cv=function(mod){h=lm.influence(mod)$hat;u=mod$residuals;
resu=mean((u/(1-h))^2);sqrt(resu)}

Si l'on fait une hypothèse optimiste d'indépendance, on a une estimée de l'écart-type de CV (la variance de la moyenne est la variance individuelle divisée par le nombre d'individus), qui a quand même le mérite de donner un ordre de grandeur permettant une comparaison raisonnable des différents CV:

sv=function(mod){h=lm.influence(mod)$hat;u=mod$residuals;v=(u/(1-h))^2;
v=v-mean(v); resu=mean(v^2)/length(u);sqrt(resu)}

Source

Peixoto, J.L. (1990) ``A property of well-formulated polynomial regression models'', American Statistician/, 44, 26-30.
Also found in: Hand, D.J., et al. (1994) /A Handbook of Small Data Sets/, London: Chapman & Hall, 208-210.
Emprunté à la page internet de Larry Wasserman.