next up previous contents index
Next: Épreuve de Kolmogorov et Up: Méthodes générales de mise Previous: Méthodes générales de mise   Contents   Index

Épreuve du

Cette épreuve donne une mesure de la déviation entre une distribution empirique et une distribution donnée ad hoc qui est supposée décrire la réalité. Plus spécifiquement, supposons qu'une expérience soit décrite par une variable aléatoire , à valeurs dans un espace , distribuée selon une loi connue (i.e. pour toute partie mesurable de , on connaît ). On partitionne l'espace en un nombre fini des parties (disjointes) et on note . (Les valeurs exactes des sont explicitement connues puisque la loi est connue). Ainsi, , est une probabilité sur . Dans la suite, on se limite au cas où toutes les parties sont chargées par c'est-à-dire où , pour tout . Considérons maintenant une famille de variables aléatoires à valeurs dans , indépendantes et équi-distribuées et formons la variable aléatoire


Il est évident que la variable aléatoire est aussi une probabilité (aléatoire) sur , appelée ``probabilité empirique''. Si les variables aléatoires sont engendrées selon la loi , on s'attend à ce que les deux probabilités et soient proches. On mesure la proximité entre deux vecteurs probabilité et sur à l'aide d'une distance pondérée.

En choisissant pour et pour la probabilité empirique, on obtient la variable aléatoire
(3.1)

qui est aussi une distance entre et la probabilité empirique. L'importance de la variable aléatoire est due aux deux théorèmes qui suivent et dont la démonstration se trouve dans [#!Cra!#].



On voit qu'asymptotiquement, la loi de la distance aléatoire suit une loi du à degrés de liberté. En réalité, la variable aléatoire suit la loi dès que l'effectif théorique dans chaque classe est suffisamment grand (dépasse 20). Les valeurs de la fonction de répartition d'une variable aléatoire suivant la loi sont tabulées pour diverses valeurs de . Ainsi, si est l'hypothèse que la fonction de répartition des variables aléatoires est où est une fonction de répartition donnée, alors sera l'hypothèse . Sous l'hypothèse on calcule la distance aléatoire et l'on cherche dans les tables le quantile défini par avec . Le tableau [*] donne un extrait de cette tabulation.


Table: Les quantiles pour diverses valeurs de . On rappelle que , pour .
  0,995 0,990 0,975 0,950 0,900 0,750 0,500
               
1   7,879 6,635 5,034 3,841 2,706 1,323 0,455
2   10,60 9,210 7,287 5,991 4,605 2,773 1,386
3   12,84 11,34 9,348 7,815 6,251 4,108 2,366
4   14,86 13,28 11,14 9,488 7,779 5,385 3,357
5   16,75 15,09 12,83 11,07 9,236 6,626 4,351
                 
6   18,55 16,81 14,45 12,59 10,64 7,841 5,348
7   20,28 18,48 16,01 14,07 12,02 9,037 6,346
8   21,96 20,09 17,53 15,51 13,36 10,22 7,344
9   23,59 21,67 19,02 16,92 14,68 11,39 8,434
10   25,19 23,21 20,48 18,31 15,99 12,55 9,342



next up previous contents index
Next: Épreuve de Kolmogorov et Up: Méthodes générales de mise Previous: Méthodes générales de mise   Contents   Index
Dimitri Petritis 2003-07-03