Diams

Description

Pour 308 diamants on dispose des variables suivantes:

Poids (carats)
Couleur (D, E, F, G, H, I): La note va a priori de D (sans couleur) à Z
Clarté (IF, VVS1, VVS2, VS1, VS2): IF > VVS1 > VVS2 > VS1 > VS2
Organisme certificateur (GIA, IGI, HRD)
Prix ($ de Singapore)

On se propose de voir si l'on peut prédire le prix en fonction des autres variables.

Analyse  (R)

Lire les données sous R.

Tracer le prix en fonction du poids. Que voit-on apparaître?
Corriger cela à l'aide d'un changement de variable adéquat.

Faire un modèle de régression prenant en compte toutes les variables,
comme au tp Voiture et regarder le résultat avec summary. Que penser du R2?

Utiliser la méthode des résidus partiels pour l'étude de la dépendance en fonction du poids.
Commande: residuals(modele,type='partial')
Comparer avec une représentation directe de y en fonction du poids.

Vérifier que l'ordre mis sur les variables qualitatives par les valeurs
des coefficients correspond bien à ce qui est annoncé.

Utiliser la fonction plot appliquée directement au modèle obtenu pour faire apparaître la droite de Henri.
Comparer à ce que l'on obtient si l'on ne fait pas les changements de variables.

Source

JSE Data Archive. Pricing the C's of Diamond Stones''.