Ear Infections in Swimmers
Description
On s'intéresse aux infections de l'oreille chez les nageurs.
Chaque ligne représente un individu (une personne).
Variables:
- Swimmer: Fréquent ou occasionnel
- Location: Beach ou NonBeach (essentiellement piscine)
- Age: 3 classes
- Sex
- Infections: Nombre d'infections de l'oreille comptabilisées.
Analyse
Récupérer les données et les lire.
Faire l'analyse du modèle linéaire
généralisé. Voici les commandes pour le
modèle avec toutes interaction:
mdl=glm(Infections~Swimmer*Location*Age*Sex,fam=poisson,data=nageur)
anova(mdl,test='Ch')
Quel modèle retient-on ?
Note: Pour tester les différents modèles
on pourra s'inspirer de la remarque suivante extraite de la documentation R (article 'formula {stats}'):
« (a+b+c)^2-a:b is identical to a+b+c+b:c+a:c »
Compléter l'étude
par un commentaire du tableau suivant
(tapply() applique la fonction donnée en
troisième argument
au tableau donné en premier, pour chaque
combinaison de facteurs du second):
tapply(fitted(mdl),list(Swimmer,Location),mean)
NonBeach Beach
Occas 2.261286 1.3596173
Freq 1.224948 0.7365101
Dans quel sens influe le facteur NonBeach/Beach et
le facteur Occas/Freq ?
plot(fitted(mdl),residuals(mdl))
Commenter l'affirmation suivante : «The residual plot
shows no reason to doubt the assumed mean-variance relationship».
Source
OzDASL
Val Gebski, from a private communication from Cameron Kirton
of the New South Wales Water Board, Sydney, Australia.
Hand D.J., Daly F., Lunn A.D., McConway K.J., Ostrowski E.
(1994). A Handbook of Small Data Sets. London: Chapman &
Hall. Data set 328