Ear Infections in Swimmers

Description

On s'intéresse aux infections de l'oreille chez les nageurs.
Chaque ligne représente un individu (une personne).

Variables:

Analyse

Récupérer les données et les lire.

Faire l'analyse du modèle linéaire généralisé. Voici les commandes pour le modèle avec toutes interaction:

mdl=glm(Infections~Swimmer*Location*Age*Sex,fam=poisson,data=nageur)
anova(mdl,test='Ch')

Quel modèle retient-on ? Note: Pour tester les différents modèles on pourra s'inspirer de la remarque suivante extraite de la documentation R (article 'formula {stats}'): « (a+b+c)^2-a:b is identical to a+b+c+b:c+a:c »

Compléter l'étude par un commentaire du tableau suivant
(tapply() applique la fonction donnée en troisième argument au tableau donné en premier, pour chaque combinaison de facteurs du second):

tapply(fitted(mdl),list(Swimmer,Location),mean)

      NonBeach     Beach
Occas 2.261286 1.3596173
 Freq 1.224948 0.7365101

Dans quel sens influe le facteur NonBeach/Beach et le facteur Occas/Freq ?

plot(fitted(mdl),residuals(mdl))

Commenter l'affirmation suivante : «The residual plot shows no reason to doubt the assumed mean-variance relationship».

Source

OzDASL
Val Gebski, from a private communication from Cameron Kirton of the New South Wales Water Board, Sydney, Australia.
Hand D.J., Daly F., Lunn A.D., McConway K.J., Ostrowski E. (1994). A Handbook of Small Data Sets. London: Chapman & Hall. Data set 328