Statistiques
Statistiques
descriptives
Échantillonage Éstimation
Statistiques inférentielles
Statistiques Calculateurs
© The scientific sentence. 2010
|
Mathématiques: Statistiques
Tests non paramétriques
Test de Wilcoxon
1. Le test de Wilcoxon
L'idée de Wilcoxon est de remplacer les valeurs observées par leurs rangs signés.
Le test de Wilcoxon est un test non paramétrique. Il compare deux mesures d'une variable quantitative effectuées sur les mêmes sujets.
Il est utilisé comme l'alternative non paramétrique
du test paramétrique t de Student pour deux échantillons dépendants ou appariés.
Plus précisément, pour deux échantillons dépendants, lorsque les hypothèses du test t de Student ne sont pas valables, c'est à dire si la distribution de la variable n'est pas normale et que l'égalité des variances n'est pas satisfaite, on passe au test de Wilcoxon.
Ce test est donc libre de distribution (distribution-free), car il n'y a plus de conditions sur la nature de la distribution des données. Cependant, le test de Wilcoxon est moins puissant que le test de Student, qui, lui est
soumis à des conditions.
En toute rigueur, lorsque les données sont
gaussiennes, on doit plutôt utiliser le test t de Student.
Ce test est aussi appelé test des rangs signés (signed rank) de Wilcoxon.
La distribution d'échantillonnage de W ne suit pas une loi normale
pour les vingts premiers rangs signés. Ainsi pour faire un test
d'hypothèses, on se réfère à des tables.
Lorsque Nr est supérieur ou égal à 20, la distribution
d'échantillonnage de W est approximée par la distribution normale:
W ∼ N(Nr(Nr+1)/4,√(Nr(Nr+1)(2Nr+1)/24))
de moyenne:
μ = Nr(Nr+1)/4,
et
d'ecart-type:
σ = √(Nr(Nr+1)(2Nr+1)/24).
2 Le principe du test
Sur une paire de deux séries d'observations où
le nombre de paires d'observations est noté N, on postule:
H0: La moyenne des différences entre les valeurs de
la paire de deux séries d'observations est nulle.
H1: Cette moyenne des différences n'est pas nulle.
On effectue les étapes suivantes:
À partir de deux ensembles de données appariées
de deux variables aléatoires Xa et Xb,
. On construit la différence absolue |Xa-Xb| pour
chaque paire,
. Omettre les cas où |Xa-Xb| = 0;
Ainsi le nombre de rangs signés Nr est égal au
nombre de paires (Xa,Xb) moins le nombre de paires
pour lesquelles |Xa - Xb| = 0.
. Classer ces différences dans l'ordre croissant,
Dans le cas où il y a des ex aequo on leur attribue
le rang moyen comme s'ils étaient distincts.
. Assigner à chaque rang un signe "+" lorsque Xa - Xb > 0
et un signe "-" lorsque Xa - Xb < 0,
. Calculer la somme des rangs des différences positives (W+)
. Calculer la somme des rangs des différences négatives (W-)
. Prendre la plus petite valeur des W+ ou W-, on la note Wo. Cette valeur Wo calculée est la valeur W du test de Wilcoxon,
. Comparer:
. a) Si le nombre de rangs signés Nr est inférieur ou égal à 20,
on compare la valeur Wo observée à la valeur Wc critique
tabulée ou fourni par un logiciel.
Le Wc est fonction du nombre de rangs signées Nr et du
risque d'erreur α.
. b) Si le nombre de rangs signés Nr est supérieur ou égal à 20,
la distribution de W tend vers une distribution normale de moyenne
μ = Nr(Nr+1)/4, et d'écart-type σ =
√(Nr(Nr+1)(2Nr+1)/24).
On calcule Zo = |Wo - μ|/σ
on compare donc la valeur Zo observée (calculée) à la
valeur Z critique donnée par la distribution normale
réduite.
. Décider:
Nr ≤ 20:
. Si Wo ≥ Wc : on rejette l'hypothèse nulle Ho,
. Si Wo < Wc : on accèpte l'hypothèse nulle Ho
: les échantillons sont homgènes.
Nr ≥ 20:
. Si Zo ≥ Zc : on rejette l'hypothèse nulle Ho,
. Si Zo < Zc : on accèpte l'hypothèse nulle Ho
: les échantillons sont homgènes.
La valeur Z critique de la loi normale réduite à considérer
est égale à la valeur de Z pour la probabilité P(Z) = 0.05.
Ceci correspond à un le seuil de risque α = 0.05.
α = 0.05 → P(Z) = (1 - α)/2 = 0.475
qui donne Z = 0.121.
3. Nombre de rangs signées inférieur ou égal à 20 (Nr ≤ 20)
Exemple
On pèse dix oranges à deux reprises séparées
d'une semaine d'intervalle.
On observe les valeurs
suivantes où Xa et Xb désignent respectivemenet les
masses d'une orange avant et aprés:
|
|
|
Xa - Xb |
i |
Xa |
Xb |
sig |
abs |
1 |
195 |
200 |
1 |
5 |
2 |
195 |
193 |
–1 |
2 |
3 |
193 |
199 |
1 |
6 |
4 |
196 |
196 |
|
0 |
5 |
195 |
197 |
1 |
2 |
6 |
194 |
191 |
-1 |
3 |
7 |
198 |
199 |
1 |
1 |
8 |
203 |
200 |
–1 |
3 |
9 |
197 |
201 |
1 |
4 |
10 |
200 |
198 |
–1 |
2 |
|
→ |
|
|
|
Xa - Xb |
i |
Xa |
Xb |
sign |
abs |
rang |
sign.rang |
4 |
196 |
196 |
|
0 |
|
|
7 |
198 |
199 |
1 |
1 |
1 |
1 |
2 |
195 |
193 |
–1 |
2 |
3 |
- 3 |
5 |
195 |
197 |
1 |
2 |
3 |
3 |
10 |
200 |
198 |
–1 |
2 |
3 |
–3 |
6 |
194 |
191 |
–1 |
3 |
5.5 |
–5.5 |
8 |
203 |
200 |
–1 |
3 |
5.5 |
–5.5 |
9 |
197 |
201 |
1 |
4 |
7 |
7 |
1 |
195 |
200 |
1 |
5 |
8 |
8 |
3 |
193 |
199 |
1 |
6 |
9 |
9 |
|
. Une seule orange (4eme) n'a pas changé de masse,
. 5 oranges ont pris du poids,
. 4 oranges ont perdu du poids.
Maintenant, on calcule la somme rangs signés:
Positifs W+ = 1 + 3 + 7 + 8 + 9 = 28
Positifs W- = 3 + 3 + 5.5 + 5.5 = 17
On a toujours W+ + W- = Nr(Nr + 1)/2. Nr étant le
nombre de rangs.
La plus petite valeur est égale à Wo = min(W+,W-) = 17.
Avec un seuil de signification bilatéral α = 0.05,
pour Nr = 9, on a Wc = 6.
Wc < Wo. On rejette donc l'hypothèse nulle:
Il y a une différence entre les masses des
oranges. Leurs masses ont changé durant la
semaine.
4. Nombre de rangs signées supérieur ou égal à 20 (Nr ≥ 20)
Exemple
On recommence la même expérience avec
21 oranges.
|
|
|
Xa - Xb |
i |
Xa |
Xb |
sig |
abs |
1 |
195 |
200 |
1 |
5 |
2 |
195 |
193 |
–1 |
2 |
3 |
193 |
199 |
1 |
6 |
4 |
196 |
196 |
|
0 |
5 |
195 |
197 |
1 |
2 |
6 |
194 |
191 |
-1 |
3 |
7 |
198 |
199 |
1 |
1 |
8 |
203 |
200 |
–1 |
3 |
9 |
197 |
201 |
1 |
4 |
10 |
200 |
198 |
–1 |
2 |
11 |
195 |
200 |
1 |
5 |
12 |
195 |
193 |
–1 |
2 |
13 |
193 |
199 |
1 |
6 |
14 |
196 |
196 |
|
0 |
15 |
195 |
197 |
1 |
2 |
16 |
194 |
191 |
-1 |
3 |
17 |
198 |
199 |
1 |
1 |
18 |
203 |
200 |
–1 |
3 |
19 |
197 |
201 |
1 |
4 |
20 |
200 |
198 |
–1 |
2 |
21 |
200 |
200 |
|
0 |
|
→ |
|
|
|
Xa - Xb |
i |
Xa |
Xb |
sign |
abs |
rang |
sign.rang |
4 |
196 |
196 |
|
0 |
|
|
14 |
196 |
196 |
|
0 |
|
|
21 |
200 |
200 |
|
0 |
|
|
7 |
198 |
199 |
1 |
1 |
1.5 |
1.5 |
17 |
198 |
199 |
1 |
1 |
1.5 |
1.5 |
2 |
195 |
193 |
–1 |
2 |
5.5 |
- 5.5 |
12 |
195 |
193 |
–1 |
2 |
5.5 |
- 5.5 |
5 |
195 |
197 |
1 |
2 |
5.5 |
5.5 |
15 |
195 |
197 |
1 |
2 |
5.5 |
5.5 |
10 |
200 |
198 |
–1 |
2 |
5.5 |
–5.5 |
20 |
200 |
198 |
–1 |
2 |
5.5 |
–5.5 |
6 |
194 |
191 |
–1 |
3 |
10.5 |
–10.5 |
16 |
194 |
191 |
–1 |
3 |
10.5 |
–10.5 |
8 |
203 |
200 |
–1 |
3 |
10.5 |
–10.5 |
18 |
203 |
200 |
–1 |
3 |
10.5 |
–10.5 |
9 |
197 |
201 |
1 |
4 |
13.5 |
13.5 |
19 |
197 |
201 |
1 |
4 |
13.5 |
13.5 |
1 |
195 |
200 |
1 |
5 |
15.5 |
15.5 |
11 |
195 |
200 |
1 |
5 |
15.5 |
15.5 |
3 |
193 |
199 |
1 |
6 |
17.5 |
17.5 |
13 |
193 |
199 |
1 |
6 |
17.5 |
17.5 |
|
W+ = 1.5 + 1.5 + 5.5 + 5.5 + 13.5
+ 13.5 + 15.5 + 15.5 + 17.5 + 17.5 = 107
W- = 5.5 + 5.5 + 5.5 + 5.5 +
10.5 + 10.5 + 10.5 + 10.5 = 64
W+ + W- = 107 + 64 = 171
W+ + W- = 171 = Nr(Nr + 1)/2
Donc Nr = 18 et non 17.5.
Wo = 64
Nr = 18
μ = Nr(Nr + 1)/4 = (18 x 19)/4 = 85.5
σ = √(Nr(Nr + 1)(2Nr + 1)/24)
= √(18 x 19 x 37/24) = 22.96
Z = |W0 - μ|/σ =
|64 - 85.5|/22.96 = 0.936
On compare la valeur calculée de Z à la valeur lue sur la table de
la loi normale réduite. ou à la valeur donné par un logiciel.
Nous avons P(Z) pris égal à 0,05
correspond à Z = 0.12 donné par le logiciel.
loi
normale centrée réduite
0.936 > 0.121, on rejette donc l'hypothèse nulle. Il y a une
différence entre les masses des oranges.
Table des valeurs de Wc de Wilcoxon:
Nr est le nombre de rangs:
| Seuil de signification inilatéral (α/2) |
| 0.025 | 0.01 | 0.005 |
| Seuil de signification bilatéral (α) |
Nr | 0.05 | 0.02 | 0.01 |
6 | 0 | - | - |
7 | 2 | 0 | - |
8 | 4 | 2 | 0 |
9 | 6 | 3 | 2 |
10 | 8 | 5 | 3 |
11 | 11 | 7 | 5 |
12 | 14 | 10 | 7 |
13 | 17 | 13 | 10 |
14 | 21 | 16 | 13 |
15 | 25 | 20 | 16 |
16 | 30 | 24 | 20 |
17 | 35 | 28 | 23 |
18 | 40 | 33 | 28 |
19 | 46 | 38 | 32 |
20 | 52 | 43 | 38 |
21 | 59 | 49 | 43 |
22 | 66 | 56 | 49 |
23 | 73 | 62 | 55 |
24 | 81 | 69 | 61 |
25 | 89 | 77 | 68 |
|
|