Test de Shapiro-Wilk
Apparence
Test de Shapiro-Wilk
Type | |
---|---|
Nommé en référence à | |
Formule |
En statistique, le test de Shapiro–Wilk teste l'hypothèse nulle selon laquelle un échantillon est issu d'une population normalement distribuée. Il a été publié en 1965 par Samuel Sanford Shapiro et Martin Wilk[1].
Théorie
[modifier | modifier le code]La statistique de test est:
où
- x(i) (avec des parenthèses entourant l'indice i) désigne la ième statistique d'ordre, i.e., le ième plus petit nombre dans l'échantillon;
- est la moyenne de l'échantillon;
- la constante ai est donnée par [2]
- où
et sont les espérances des statistiques d'ordre d'un échantillon de variables iid suivant une loi normale, et V est la matrice de variance-covariance de ces statistiques d'ordre.
Pour conclure, est alors comparé à une table[3].
Interprétation
[modifier | modifier le code]Sachant que l'hypothèse nulle est que la population est normalement distribuée,
- si la p-value est inférieure à un niveau alpha choisi (par exemple 0.05), alors l'hypothèse nulle est rejetée (i.e. il est improbable d'obtenir de telles données en supposant qu'elles soient normalement distribuées).
- si la p-value est supérieure au niveau alpha choisi (par exemple 0.05), alors on ne doit pas rejeter l'hypothèse nulle. La valeur de la p-value alors obtenue ne présuppose en rien de la nature de la distribution des données.
Voir aussi Q-Q plot ou droite de Henry.
Mise en œuvre
[modifier | modifier le code]shapiro.test()
avec R.
Voir aussi
[modifier | modifier le code]Références
[modifier | modifier le code]- (en) S. S. Shapiro et M. B. Wilk, « An analysis of variance test for normality (complete samples) », Biometrika, vol. 52, nos 3-4, , p. 591–611 (DOI 10.1093/biomet/52.3-4.591, JSTOR 2333709).
- Shapiro et Wilk 1965, p. 593.
- Shapiro et Wilk 1965, p. 605.