Stats1    
 
  Stats2    
 
  Stats3    
 
  Z(0,1)    
 
  Probabilités    
 
  CombCalculator   
 
  N(0,1) MonteCarlo   
 
  Units   
 
  home  
 
  ask us  
 

 
Statistiques







© The scientific sentence. 2010


Mathématiques: Statistiques
Tests non paramétriques
Test de Wilcoxon




1. Le test de Wilcoxon

L'idée de Wilcoxon est de remplacer les valeurs observées par leurs rangs signés.

Le test de Wilcoxon est un test non paramétrique. Il compare deux mesures d'une variable quantitative effectuées sur les mêmes sujets.

Il est utilisé comme l'alternative non paramétrique du test paramétrique t de Student pour deux échantillons dépendants ou appariés.

Plus précisément, pour deux échantillons dépendants, lorsque les hypothèses du test t de Student ne sont pas valables, c'est à dire si la distribution de la variable n'est pas normale et que l'égalité des variances n'est pas satisfaite, on passe au test de Wilcoxon.

Ce test est donc libre de distribution (distribution-free), car il n'y a plus de conditions sur la nature de la distribution des données. Cependant, le test de Wilcoxon est moins puissant que le test de Student, qui, lui est soumis à des conditions.

En toute rigueur, lorsque les données sont gaussiennes, on doit plutôt utiliser le test t de Student.

Ce test est aussi appelé test des rangs signés (signed rank) de Wilcoxon.


La distribution d'échantillonnage de W ne suit pas une loi normale pour les vingts premiers rangs signés. Ainsi pour faire un test d'hypothèses, on se réfère à des tables.

Lorsque Nr est supérieur ou égal à 20, la distribution d'échantillonnage de W est approximée par la distribution normale:

W ∼ N(Nr(Nr+1)/4,√(Nr(Nr+1)(2Nr+1)/24))

de moyenne: μ = Nr(Nr+1)/4, et
d'ecart-type: σ = √(Nr(Nr+1)(2Nr+1)/24).




2 Le principe du test

Sur une paire de deux séries d'observations où le nombre de paires d'observations est noté N, on postule:

H0: La moyenne des différences entre les valeurs de la paire de deux séries d'observations est nulle.

H1: Cette moyenne des différences n'est pas nulle.


On effectue les étapes suivantes:

À partir de deux ensembles de données appariées de deux variables aléatoires Xa et Xb,

. On construit la différence absolue |Xa-Xb| pour chaque paire,

. Omettre les cas où |Xa-Xb| = 0; Ainsi le nombre de rangs signés Nr est égal au nombre de paires (Xa,Xb) moins le nombre de paires pour lesquelles |Xa - Xb| = 0.

. Classer ces différences dans l'ordre croissant, Dans le cas où il y a des ex aequo on leur attribue le rang moyen comme s'ils étaient distincts.

. Assigner à chaque rang un signe "+" lorsque Xa - Xb > 0 et un signe "-" lorsque Xa - Xb < 0,

. Calculer la somme des rangs des différences positives (W+)

. Calculer la somme des rangs des différences négatives (W-)

. Prendre la plus petite valeur des W+ ou W-, on la note Wo. Cette valeur Wo calculée est la valeur W du test de Wilcoxon,

. Comparer:

. a) Si le nombre de rangs signés Nr est inférieur ou égal à 20, on compare la valeur Wo observée à la valeur Wc critique tabulée ou fourni par un logiciel.

Le Wc est fonction du nombre de rangs signées Nr et du risque d'erreur α.

. b) Si le nombre de rangs signés Nr est supérieur ou égal à 20, la distribution de W tend vers une distribution normale de moyenne μ = Nr(Nr+1)/4, et d'écart-type σ = √(Nr(Nr+1)(2Nr+1)/24).

On calcule Zo = |Wo - μ|/σ

on compare donc la valeur Zo observée (calculée) à la valeur Z critique donnée par la distribution normale réduite.


. Décider:

Nr ≤ 20:

. Si Wo ≥ Wc : on rejette l'hypothèse nulle Ho,
. Si Wo < Wc : on accèpte l'hypothèse nulle Ho : les échantillons sont homgènes.

Nr ≥ 20:

. Si Zo ≥ Zc : on rejette l'hypothèse nulle Ho,
. Si Zo < Zc : on accèpte l'hypothèse nulle Ho : les échantillons sont homgènes.

La valeur Z critique de la loi normale réduite à considérer est égale à la valeur de Z pour la probabilité P(Z) = 0.05. Ceci correspond à un le seuil de risque α = 0.05.

α = 0.05 → P(Z) = (1 - α)/2 = 0.475
qui donne Z = 0.121.



3. Nombre de rangs signées inférieur ou égal à 20 (Nr ≤ 20)

Exemple



On pèse dix oranges à deux reprises séparées d'une semaine d'intervalle.

On observe les valeurs suivantes où Xa et Xb désignent respectivemenet les masses d'une orange avant et aprés:


Xa - Xb
i Xa Xb sig abs
1 195 200 1 5
2 195 193  –1 2
3 193 199 1 6
4 196 196   0
5 195 197 1 2
6 194 191   -1 3
7 198 199 1 1
8 203 200  –1 3
9 197 201 1 4
10 200 198  –1 2
      Xa - Xb
i Xa Xb sign abs rang sign.rang
4 196 196   0    
7 198 199 1 1 1 1
2 195 193  –1 2 3 - 3
5 195 197 1 2 3 3
10 200 198  –1 2 3  –3
6 194 191  –1 3 5.5  –5.5
8 203 200  –1 3 5.5  –5.5
9 197 201 1 4 7 7
1 195 200 1 5 8 8
3 193 199 1 6 9 9


. Une seule orange (4eme) n'a pas changé de masse,
. 5 oranges ont pris du poids,
. 4 oranges ont perdu du poids.

Maintenant, on calcule la somme rangs signés:
Positifs W+ = 1 + 3 + 7 + 8 + 9 = 28 Positifs W- = 3 + 3 + 5.5 + 5.5 = 17 On a toujours W+ + W- = Nr(Nr + 1)/2. Nr étant le nombre de rangs.

La plus petite valeur est égale à Wo = min(W+,W-) = 17.

Avec un seuil de signification bilatéral α = 0.05, pour Nr = 9, on a Wc = 6.

Wc < Wo. On rejette donc l'hypothèse nulle: Il y a une différence entre les masses des oranges. Leurs masses ont changé durant la semaine.



4. Nombre de rangs signées supérieur ou égal à 20 (Nr ≥ 20)

Exemple

On recommence la même expérience avec 21 oranges.

Xa - Xb
i Xa Xb sig abs
1 195 200 1 5
2 195 193  –1 2
3 193 199 1 6
4 196 196   0
5 195 197 1 2
6 194 191   -1 3
7 198 199 1 1
8 203 200  –1 3
9 197 201 1 4
10 200 198  –1 2
11 195 200 1 5
12 195 193  –1 2
13 193 199 1 6
14 196 196   0
15 195 197 1 2
16 194 191   -1 3
17 198 199 1 1
18 203 200  –1 3
19 197 201 1 4
20 200 198  –1 2
21 200 200   0
      Xa - Xb
i Xa Xb sign abs rang sign.rang
4 196 196   0    
14 196 196   0    
21 200 200 0
7 198 199 1 1 1.5 1.5
17 198 199 1 1 1.5 1.5
2 195 193  –1 2 5.5 - 5.5
12 195 193  –1 2 5.5 - 5.5
5 195 197 1 2 5.5 5.5
15 195 197 1 2 5.5 5.5
10 200 198  –1 2 5.5  –5.5
20 200 198  –1 2 5.5  –5.5
6 194 191  –1 3 10.5  –10.5
16 194 191  –1 3 10.5  –10.5
8 203 200  –1 3 10.5  –10.5
18 203 200  –1 3 10.5  –10.5
9 197 201 1 4 13.5 13.5
19 197 201 1 4 13.5 13.5
1 195 200 1 5 15.5 15.5
11 195 200 1 5 15.5 15.5
3 193 199 1 6 17.5 17.5
13 193 199 1 6 17.5 17.5


W+ = 1.5 + 1.5 + 5.5 + 5.5 + 13.5
+ 13.5 + 15.5 + 15.5 + 17.5 + 17.5 = 107

W- = 5.5 + 5.5 + 5.5 + 5.5 +
10.5 + 10.5 + 10.5 + 10.5 = 64

W+ + W- = 107 + 64 = 171

W+ + W- = 171 = Nr(Nr + 1)/2
Donc Nr = 18 et non 17.5.

Wo = 64
Nr = 18


μ = Nr(Nr + 1)/4 = (18 x 19)/4 = 85.5

σ = √(Nr(Nr + 1)(2Nr + 1)/24)
= √(18 x 19 x 37/24) = 22.96

Z = |W0 - μ|/σ =
|64 - 85.5|/22.96 = 0.936

On compare la valeur calculée de Z à la valeur lue sur la table de la loi normale réduite. ou à la valeur donné par un logiciel.

Nous avons P(Z) pris égal à 0,05 correspond à Z = 0.12 donné par le logiciel.

loi normale centrée réduite

0.936 > 0.121, on rejette donc l'hypothèse nulle. Il y a une différence entre les masses des oranges.






Table des valeurs de Wc de Wilcoxon:
Nr est le nombre de rangs:




Seuil de signification inilatéral (α/2)
0.025 0.01 0.005
Seuil de signification bilatéral (α)
Nr 0.05 0.02 0.01
6 0 - -
7 2 0 -
8 4 2 0
9 6 3 2
10 8 5 3
11 11 7 5
12 14 10 7
13 17 13 10
14 21 16 13
15 25 20 16
16 30 24 20
17 35 28 23
18 40 33 28
19 46 38 32
20 52 43 38
21 59 49 43
22 66 56 49
23 73 62 55
24 81 69 61
25 89 77 68














  


chimie labs
|
Physics and Measurements
|
Probability & Statistics
|
Combinatorics - Probability
|
Chimie
|
Optics
|
contact
|


© Scientificsentence 2010. All rights reserved.