Données longitudinales et modèles mixtes

Enfants

Description

Il s'agit de proposer un modèle de croissance pour des enfants de 12 à 14 ans. L'échantillon contient a 26 enfants.
On mesure la taille de chaque enfant tous les trois mois.

Données ici.

Analyse

Les auteurs postulent le modèle polynomial mixte où la partie à effets fixes est un polynome d'ordre 4 commun aux enfants et la partie aléatoire est une perturbation représentée par un polynome d'ordre 2 à coefficients aléatoires.
La commande pour de modèle proposé est

lmp = lme(taille~1+age+I(age^2)+I(age^3)+I(age^4),random=~1+age+I(age^2)|sujet)

(charger auparavant la bibliothèque nlme). S'intéresser aux coefficients estimés (summary) et aux intervalles de confiance (intervals).

Pour le tracé des courbes on pourra faire

plot(age,taille,type='n')
for(i in 1:max(sujet)){lines(age[sujet==i],taille[sujet==i])}


On essaiera de conforter ou d'infirmer le choix du modèle proposé.

Source :

  J. C.Pinheiro, and D. M.Bates, "Mixed-Effects Models in S and S-PLUS", Springer, 2000.

Pour la programmation des modèles mixtes sous R voir par exemple le document d'introduction de D.Concordet.


Nested factors: Pastes

On considère les données Pastes: library(lme4);data(Pastes).
Observer les données. On oubliera sample qui est redondant.
On pourra considérer que batch est un camion et cask un baril (extrait du camion).

Très important: Pourquoi le modèle modpl=lm(strength~cask+batch,data=Pastes) n'a-t-il pas de sens?

Comparer les modèles
modstar=lm(strength~batch*cask,data=Pastes)?
moddiv=lm(strength~batch:cask,data=Pastes)?
modslash=lm(strength~batch/cask,data=Pastes)?

Comparer modslash au modèle modms=lmer(strength~1+(1|batch/cask),data=Pastes).

Comparer modms au modèle modmp=lmer(strength~1+(1|batch)+(1|batch:cask),data=Pastes)?

Comparer modms à mod1=lme(strength~1,random=list((~1|batch),(~1|cask)),data=Pastes).
Noter que lme force l'emboîtement des facteurs.




Chlore

Il s'agit de la variation saisonnière de niveau de chlorure dans des marais proches ou éloignés d'une route du Minesota.

Données ici.

Analyse

Expliquer la variable Chloride (taux de chlorure) en fonction de Type et de Month. Considérer le facteur Marsh (numéro de marais) comme aléatoire.

On pourra comparer les trois modèles (effets fixes sans Marsh, effets fixes avec Marsh, et effets aléatoires) avec le critère BIC. Considérer également les intervalles de confiance.

On essayera également: library(lme4); modr = lmer(Cl~Type+(1|Marsh)+(1|Month),data=chl)
Donner l'équation correspondant à cette commande.

Source :

Weisberg, "Applied Linnear Regression", 3rd edition. New York: Wiley, Section 6.5.


Fatigue

On considère les données Fatigue de la bibliothèque nlme. Il s'agit d'expliquer relLength (longueur de craquelure) en fonction de cycles (nombre de sollicitations, en million). La variable Path est un numéro de test.

On oublie pour l'instant la variable Path. Proposer un changement logarithmique translaté qui semble adapté pour obtenir un modèle linéaire.
Proposer un modèle mixte pour prendre en compte Path bien que son effet spécifique ne présente pas d'intérêt dans l'étude.