Mathématiques 1ère S
Maths 1S programme
Analyse
Géométrie
Exercices
Probabilités &
Statistiques
Applications
Suites & Séries
Calculateurs
Algèbre linéaire
© The scientific sentence. 2010
|
Mathématiques 3: Probabilités
Loi binomiale
Statistiques
1. Définitions
Dans le sens commun, au sondages par exemple , un
échantillon est un sous-ensemble obtenu par prélèvement
aléatoire dans une population.
On utilise aussi le terme échantillon en
probabilité. Un échantillon de taille n est constitué
des résultats de n répétitions indépendantes de la même
expérience.
On a:
• Intervalle de fluctuation d’une fréquence.
• Intervalle de confiance d’une proportion.
2. Intervalle de fluctuation
2.1. Définitions
On utilise un intervalle de fluctuation
lorsque la proportion p dans la population est connue
ou si l’on fait une hypothèse sur sa valeur
et le prise de décision sera faite à partir d’un échantillon .
La fréquence f observée dans un échantillon « doit »
appartenir à l’intervalle de fluctuation considéré.
Une approximation de l'expression de l'intervalle de fluctuation
est:
If = [p - 1/√n , p + 1/√n ]
C'est l'intervalle de fluctuation au seuil de 95 %, centré
autour de p qui est la proportion du caractère dans la population.
Il contient, avec une probabilité, d'au moins égale à 0.95, la
fréquence observée dans un échantillon de taille n.
c'est en fonction de l’appartenance ou non de la fréquebce
mesurée f à l’intervalle de fluctuation à 0.95 que l’on prenne,
une décision concernant la conformité de l’échantillon.
Si f n’appartient pas à l’intervalle, on rejette, au
risque d’erreur de 5 %, l’hypothèse que l’échantillon
est compatible avec le modèle.
Dans le cas contraire, on ne peut pas rejeter
l’hypothèse.
D’après le théorème de Moivre-Laplace (approximation par la
loi normale), environ 95 % des échantillons de taille n
fournissent une fréquence f appartenant à l’intervalle:
[p - 1.96 √[p(1 - p)/n], p + 1.96 √[p(1 - p)/n] ]
On peut majorer: 1.96 √[p(1 - p)] à 1 pour
obtenir la formule précédente.
2.2. Intervalle de fluctuation et Loi binomiale
L’intervalle de fluctuation à 95% d’une fréquence
correspondant à la réalisation, sur un échantillon aléatoire,
d’une variable aléatoire X de loi B(n; p) est l’intervalle:
[a/n; b/n]
a et b sont défini par :
• a est le plus petit entier tel que P(X ≤ a) > 0.025 ;
• b est le plus petit entier tel que P(X ≤ b) ≥ 0.975.
2.3. Expression littérale de l'intervalle de
fluctuation et Loi binomiale
Si Fn = variable aléatoire qui, à tout échantillon de taille n,
associe la fréquence d’apparition du caractère dans cet
échantillon, l'intervalle de fluctuation est:
If = [p - uα√[p(1 - p)/n], p + uα√[p(1 - p)/n] ]
C'est l'intervalle de fluctuation asymptotique au seuil 1 - α de Fn
.
Il contient Fn avec une probabilité d’autant plus proche de
1 - α que n est grand.
Généralement, on prend:
α = 0.05 ; 1 - α = 0.95 ; uα = 1.96
(seuil 95 %).
3. Intervalle de confiance
3.1. Définitions
On utilise un intervalle de confiance lorsque l’on veut
estimer une proportion inconnue p dans une population à
partir de la fréquence f observée dans un échantillon
(estimation, par exemple dans le cadre d’un sondage).
Ici, Il s'agit d'une estimation d’une proportion inconnue
p grâce à un échantillon aléatoire.
Soit f la fréquence observée dans un échantillon de taille n.
On peut faire une estimation ponctuelle en posant p = f .
Cette estimation varie d’un échantillon à l’autre du fait de la
fluctuation d’échantillonnage.
On cherche donc un intervalle de confiance de la
proportion p, c’est-à-dire un intervalle contenant « très
vraisemblablement » p, à partir de la fréquence f .
3.2. Définitions
Une approximation de l'expression de l'intervalle de confiance
est:
Si n ≥ 30 et si nf > 5 et n(1 - f ) > 5, un intervalle de
confiance de p au niveau de confiance 0.95 est:
Ic = [f - 1/√n , f + 1/√n ]
Parmi tous les échantillons de taille n possibles, 95 % des
intervalles associés Ic contiennent p.
Une fois l’échantillon tiré, l’intervalle de confiance associé est
entièrement fixé, il n’y a plus d’aléatoire à ce stade.
Il est donc incorrect de dire que p a une probabilité 0.95
d’appartenir à cet intervalle (p est inconnu mais pas aléatoire).
|
|