Voitures

Description

Pour 18 types de voitures, on dispose du prix et des variables explicatives suivantes:

 cylindree, puissance,  longueur, largeur, poids, vitesse, finition (note valant 0,1 ou 2).

On se propose de voir si l'on peut prédire le prix des voitures en fonction des autres variables.
Les individus sont :

 Alfasud-ti-135           Audi-100-l             Simca-1307-gls    Citroen-gc-club
 Fiat-132-1600gls  Lancia-beta-1300    Peugeot-504                   R16-tl                  R30-ts
 Toyota-corolla            Alfetta-1.66          Princess-1800-hl    Datsun-200l
 Taunus-2000-gl            Rancho                    Mazda-9295          Opel-rekord-l          Lada-1300

Analyse sous R

Les lire les données sous R

vérifier le contenu:

dim(voit)
class(voit)
attributes(voit)

Transformer la variable finition en un facteur (variable discrète à 3 modalités)

voit$finit=factor(voit$finit)

Tracé du prix en fonction de la cyclindrée

plot(voit$cyl,voit$prix)

Régression sans la variable finition

lmp = lm(prix ~cyl+puiss+long+larg+poids+vites,data=voit)

Pour comprendre la syntaxe, on pourra chercher lm dans le help internet :
cliquer sur "Functions & Datasets", puis chercher lm.
Exécuter la commande suivante

attributes(lmp)

et en déduire les valeurs des coefficients du modèles, des prédictions, des résidus.
Noter par ailleurs les résultats des commandes suivantes

coef(lmp)
residuals(lmp)
predict(lmp)

Tracé des résidus (col donne la couleur et pos=3 met le nom au dessus):

plot(voit$prix,residuals(lmp))
text(voit$prix,residuals(lmp),labels=row.names(voit),col=2,pos=3)

Resultat de la régression

summary(lmp)

Tracer les écarts résiduels en fonction de la variable finition.
Serait-il utile d'intégrer cette variable à la régression ?
Faire la régression en intégrant la finition.

Source

Exemple du livre de Saporta page 393
"Probabilites, analyse des donnees et statistique", ed Technip.