Régression simple
Description
Il s'agit des données recueillies au 19e s par
le physicien James David Forbes en Ecosse
et dans les Alpes, et par le botaniste Joseph Dalton Hooker dans l'Himalaya.
On mesure en divers endroits la pression atmosphérique
(mm de mercure)
et la température d'ébulliton de l'eau (degré F.
Conversion: C=(F-32).5/9).
On présuppose une relation linéaire
entre t et log(p). La réponse est ici y=log(p).
L'étude sera faite avec R.
Calcul du modèle
1/ Convertir la température en
degrés Celsius.
Tracer les points
d'observation en utilisant la fonction plot
2/ Estimer le modèle
linéaire correspondant en utilisant les formules du cours.
Quelques indications
La matrice X est X=as.matrix(cbind(t*0+1,t))
La transposée de X est t(X)
Le produit de deux matrices se fait avec la commande %*%
L'inverse d'une matrice peut se faire avec la fonction ginv. Il
faut charger la bibliotheque MASS: library(MASS).
3/ Identifier directement le modèle avec lm():
mod=lm(logpres~temp))
coefficients(mod)
et vérifier la coïncidence des deux résultats.
Droite de régression
Par exemple, tracer les points et la droite avec abline():
plot(temp,logpres,ylab="Log(pression)",xlab="Temperature")
abline(lm(logpres~temp))
Prédiction
Quelle
est la pression atmosphérique prévisible si l'on observe
que l'eau bout à 94.5 degrés?
Vérifier que la commande predict(mod,data.frame(temp=94.5))
donne bien le même résultat.
Données
Données de Forbes (Alpes, Ecosse):
Temperature :
t=c(194.5,194.3,197.9,198.4,199.4,199.9,200.9,201.1,201.4,201.3,203.6,204.6,209.5,208.6,210.7,211.9,212.2)
Pression:
p=c(20.79,20.79,22.4,22.67,23.15,23.35,23.89,23.99,24.02,24.01,25.14,26.57,28.49,27.76,29.04,29.88,30.06)
Données de Hooker (Himalaya):
Temperature :
t=c(210.8,210.2,208.4,202.5,200.6,200.1,199.5,197,196.4,196.3,195.6,193.4,193.6,191.4,191.1,190.6,189.5,188.8,188.5,185.7,186.,185.6,184.1,184.6,184.1,183.2,182.4,181.9,181.9,181.,180.6)
Pression:
p=c(29.211,28.559,27.972,24.697,23.726,23.369,23.03,21.892,21.928,21.654,21.605,20.48,20.212,19.758,19.49,19.386,18.869,18.356,18.507,17.267,17.221,17.062,16.959,16.881,16.817,16.385,16.235,16.106,15.928,15.919,15.376)
Source:
"Applied Linear Regression", S.Weisberg, Wiley, 1985.
James D. Forbes,"Further Experiments and Remarks on the Measurement of Heights by the Boiling Point of Water",
Earth and Environmental Science Transactions of The Royal Society of Edinburgh
Volume 21 Issue 2, 1857.