Données longitudinales et
modèles mixtes
Enfants
Description
Il s'agit de proposer un modèle de croissance pour des enfants
de 12 à 14 ans. L'échantillon contient a 26 enfants.
On mesure la taille de chaque enfant tous les trois mois.
Données ici.
Analyse
Les auteurs postulent le modèle polynomial mixte où
la partie à effets fixes est un polynome d'ordre 4 commun
aux enfants et la partie aléatoire est une perturbation représentée
par un polynome d'ordre 2 à coefficients
aléatoires.
La commande pour de modèle proposé est
lmp = lme(taille~1+age+I(age^2)+I(age^3)+I(age^4),random=~1+age+I(age^2)|sujet)
(charger auparavant la bibliothèque nlme
). S'intéresser aux coefficients estimés (summary
) et aux intervalles de confiance (intervals
).
Pour le tracé des courbes on pourra faire
plot(age,taille,type='n')
for(i in 1:max(sujet)){lines(age[sujet==i],taille[sujet==i])}
On essaiera de conforter ou d'infirmer le choix du modèle proposé.
Source :
J. C.Pinheiro, and D. M.Bates, "Mixed-Effects Models in S and S-PLUS", Springer, 2000.
Pour la programmation des modèles mixtes sous R voir par exemple
le document d'introduction de D.Concordet.
Nested factors: Pastes
On considère les données Pastes: library(lme4);data(Pastes)
.
Observer les données. On oubliera sample
qui est redondant.
On pourra considérer que batch est un camion et cask un baril (extrait du camion).
Très important: Pourquoi le modèle modpl=lm(strength~cask+batch,data=Pastes)
n'a-t-il pas de sens?
Comparer les modèles
modstar=lm(strength~batch*cask,data=Pastes)
?
moddiv=lm(strength~batch:cask,data=Pastes)
?
modslash=lm(strength~batch/cask,data=Pastes)
?
Comparer modslash
au modèle modms=lmer(strength~1+(1|batch/cask),data=Pastes).
Comparer modms
au modèle modmp=lmer(strength~1+(1|batch)+(1|batch:cask),data=Pastes)
?
Comparer modms
à mod1=lme(strength~1,random=list((~1|batch),(~1|cask)),data=Pastes).
Noter que lme force l'emboîtement des facteurs.
Chlore
Il s'agit de la variation saisonnière de niveau de chlorure
dans des marais proches ou éloignés d'une route du Minesota.
Données ici.
Analyse
Expliquer la variable Chloride (taux de chlorure) en fonction de Type et de Month.
Considérer le facteur Marsh (numéro de marais) comme aléatoire.
On pourra comparer les trois modèles (effets fixes sans Marsh, effets fixes avec Marsh, et effets
aléatoires) avec le critère BIC. Considérer également les intervalles de confiance.
On essayera également: library(lme4)
;
modr = lmer(Cl~Type+(1|Marsh)+(1|Month),data=chl)
Donner l'équation correspondant à cette commande.
Source :
Weisberg, "Applied Linnear Regression", 3rd edition. New York: Wiley, Section 6.5.
Fatigue
On considère les données Fatigue
de la bibliothèque nlme
.
Il s'agit d'expliquer relLength
(longueur de craquelure)
en fonction de cycles
(nombre de sollicitations, en million).
La variable Path
est un numéro de test.
On oublie pour l'instant la variable Path. Proposer un changement logarithmique
translaté qui semble adapté pour obtenir un modèle linéaire.
Proposer un modèle mixte pour prendre en compte Path bien que son effet spécifique
ne présente pas d'intérêt dans l'étude.