Mathématiques 1ère S
Maths 1S programme
Analyse
Géométrie
Exercices
Probabilités &
Statistiques
Applications
Suites & Séries
Calculateurs
Algèbre linéaire
© The scientific sentence. 2010
|
Mathématiques 3:
Statistiques
Échantillonnage
Intervalle de fluctuation
1. Échantillonnage
1.1. Échantillons
Lorsqu’on travaille sur une population de grande taille, il est
rarement possible d'avoir accès aux données relatives à l'ensemble
de la population. On utilise alors un échantillon de cette population.
Exemple : Les aranges dans un un verger d'orangers.
1.2. Définitions
Un échantillon de taille n est une sélection de n individus
choisis «au hasard» dans une population.
Exemple : Un panier de 60 oranges .
1.3. Exemple
Dans un lot provenant d'un verger d'orangers, toutes
les oranges sont mûres.
On veut étudier la répartition
de couleur "orange/jaune" de la population d'oranges
dans le lot qui contient des miliers d'oranges.
Il est pratiquement impossible de recenser toutes les oranges
du lot. On décidera donc de travailler sur un échantillon
en prélevant, par exemple, 80 oranges.
La taille de l’échantillon doit être suffisamment élevée
pour fournir des résultats fiables, mais pas trop pour ne pas entrainer
un surcroit de travail.
Il existe deux manières d’effectuer un échantillonnage:
• sans remise :
Dans l’exemple précédent, si l’on prélève les 80 oranges simultanément,
on aura 80 individus différents.
• avec remise :
On prélève une orange au hasard, on note sa couleur puis
on la remet dans le lot. Et on répète cette expérience 80 fois.
Dans ce cas, il est possible de prélever plusieurs fois le même individu.
En pratique, si l’effectif global est nettement supérieur à la taille de
l’échantillon, c’est à dire, ici, si le lot contient beaucoup plus
de 80 oranges, les deux méthodes donneront des résultats
également satisfaisants.
2. Intevalle de fluctuation
Si l’on effectue plusieurs échantillonnage de même taille sur une
même population, on obtiendra en général des fréquences légèrement
différentes pour un caractère donné.
Voici, par exemple, les résultats que l’on pourrait obtenir en
prélevant 5 échantillons de 80 oranges :
Echantillons | n°1 | n°2 | n°3 | n°4 | n°5 |
Pourcentage de jaunes | 52% | 48% | 55% | 42% | 50% |
Ce phénomène s’appelle fluctuation d'échantillonnage.
3. Définition d'une loi est binomiale
Une loi est binomiale si elle suit une épreuve de Bernoulli
B(n,p).
Une épreuve de Bernoulli est une expérience aléatoire
qui a deux issues : Une avec une probabilité p, l'autre
avec une probabilité 1 - p.
Exemple le pile ou face d'une expérience de lancer 80 fois
une pièce de monnaie: B(80, 0.5).
4. Intevalle de fluctuation
4.1. Théorème et définition
On note p la proportion d’un caractère dans une
population donnée; p est connue et fixée .
On prélève un échantillon de taille n
de cette population et on note f
la fréquence du caractère dans l’échantillon.
Si 0.2 ≤ p ≤ 0,80 et si n ≥ 25
alors, dans au moins 95% des cas, f
appartient à l’intervalle :
If = [p - 1/√n , p + 1/√n]
If est appelé l’intervalle de fluctuation au seuil 95%
.
4.2. Remarques
On applique le théorème ci-dessus si on connaît la proportion
p du caractère dans la population.
On peut aussi utiliser ce théorème en supposant que le caractère est
présent dans une proportion p, c'est à dire en faisant une hypothèse
sur p:
Suivant la (ou les) fréquence(s) observée(s) dans un (ou plusieurs)
échantillon(s) on acceptera ou on rejettera l’hypothèse.
Bien retenir la signification de chacune des variables :
p = proportion du caractère dans l’ensemble de la population
f = fréquence du caractère dans l’échantillon
n = taille de l’échantillon
On a choisi le seuil de 95% car il conduit à une formule assez simple,
et en plus on peut considérer comme «raisonnablement fiable»
un résultat validé dans 95% des cas.
4.3. Exemple
Pour notre exempe d'oranges, on sait que le lot contient 55% d'oranges
orange (et donc 45% d'oranges jaunes).
Pour nos échantillons de taille 80,
n = 80 ≥ 25 ; par ailleurs p = 0.55 et
donc 0.2 ≤ p ≤ 0.8.
Donc l’intervalle de fluctuation au seuil de 95% sera
If = [0.55 - 1/√80 , 0.55 + 1/√80]
= [0.55 - 1/8.9443 , 0.55 + 1/8.9443] =
[0.55 - 0.1180 , 0.55 + 0.1180 ] = [0.4320, 0.6618]
If = [43.20% , 66.18%]
|
|