Pour 18 types de voitures, on dispose du prix et des variables explicatives suivantes:
cylindree, puissance, longueur, largeur, poids, vitesse, finition (note valant 0,1 ou 2).
On se propose de voir si l'on peut prédire le prix des
voitures en fonction des autres variables.
Les individus sont :
Alfasud-ti-135
Audi-100-l
Simca-1307-gls Citroen-gc-club
Fiat-132-1600gls
Lancia-beta-1300
Peugeot-504
R16-tl
R30-ts
Toyota-corolla
Alfetta-1.66
Princess-1800-hl Datsun-200l
Taunus-2000-gl
Rancho
Mazda-9295
Opel-rekord-l
Lada-1300
Les lire les données sous R
vérifier le contenu:
dim(voit)
class(voit)
attributes(voit)
Transformer la variable finition en un facteur (variable discrète à 3 modalités)
voit$finit=factor(voit$finit)
Tracé du prix en fonction de la cyclindrée
plot(voit$cyl,voit$prix)
Régression sans la variable finition
lmp = lm(prix
~cyl+puiss+long+larg+poids+vites,data=voit)
Pour comprendre la syntaxe, on pourra chercher
lm dans le help internet :
cliquer sur "Functions & Datasets", puis
chercher lm.
Exécuter la commande suivante
attributes(lmp)
et en déduire les valeurs des
coefficients du modèles, des prédictions, des
résidus.
Noter par ailleurs les résultats des commandes suivantes
coef(lmp)
residuals(lmp)
predict(lmp)
Tracé des résidus (col donne la couleur et pos=3 met le nom au dessus):
plot(voit$prix,residuals(lmp))
text(voit$prix,residuals(lmp),labels=row.names(voit),col=2,pos=3)
Resultat de la régression
summary(lmp)
Tracer les écarts résiduels en fonction de la variable
finition.
Serait-il utile d'intégrer cette variable à
la régression ?
Faire la régression en intégrant la finition.