Mathématiques 2
Probabilités
Probabilités conditionnelles
Exercices divers
© The scientific sentence. 2010
| Échantillonnage et Intervalle de fluctuation
Mathématiques 45: Probabilités
Échantillonnage
Intervalle de fluctuation
1. Définitions
Lorsque la population à étudier est de grande taille, on ne peut pas
étudier chaque individu isolé, on prélève alors un échantillon de
cette population.
Un échantillon de taille n
est un ensemble de n individus pris « au hasard » dans une population.
Un échantillon issu d’une population est donc l’ensemble de quelques éléments de cette
population.
Lorsqu'il s'agit d'une expérience aléatoire, comme lancer un dé,
un échantillon de taille n est l'ensemble des n répétitions indépendantes de la
même expérience de lancer.
En probabilité, l’échantillonnage est l'ensemble des n
répétitions indépendantes de la même expérience.
Pour avoir des résultats fiables, la taille de l'échantillon doit être
relativement grande.
On peut effectuer un échantillonnage de deux manières:
• sans remise : On ne remet pas l'individu tiré dans l'échantillon.
• avec remise : On remet l'individu tiré dans l'échantillon. Toutefois,
il est possible de prélever plusieurs fois le même individu. Cet
échantillonnage est satisfaisant pour une population de grande taille.
2. Intervalle de fluctuation
Si l'on répète l'échantillonnage de même taille plusieurs fois
sur une même population, on obtiendra , pour un caratère à étudier donné,
des fréquences légèrement différentes. Ce phénomène s’appelle
fluctuation d’échantillonnage.
Défintion:
Soit p la proportion d'un caractère dans une population donnée.
On prélève un échantillon de taille n de cette population et on note
f la fréquence du caractère cet l’échantillon.
Si
0.2 ≤ p ≤ 0.8 et si n ≥ 25,
alors, dans au moins 95% des cas, f appartient à l’intervalle :
I est appelé l'intervalle de fluctuation au seuil 95%.
L’intervalle I contient donc environ 95% des fréquences observées dans les
échantillons de taille n suffisamment grande. Des fréquences (environ 5%) de
certains échantillons ne sont pas dans I.
La probabilité de se tromper est donc de 0.05. On parle alors d'un seuil
de confiance de 95 %. L'intervalle de fluctuation est aussi appelé
l'intervalle de confiance .
3. Précisions
Bien entendu, on applique la difinition ci-dessus si on connaît la proportion p
du caractère dans la population. On note bien que p est théorique ou
admis.
• p = proportion du caractère dans l’ensemble de la population
• n = taille de l’échantillon. On note bien que f est expérimentale ou
observée .
• f = fréquence du caractère dans l’échantillon
En Statistiques, les intervalles de fluctuation au seuil de 95%,
décrits par la formule ci-dessus, sont considérés comme raisonnables,
puisquIls limitent un résultat validé dans 95% des cas.
Lors des tirages effectués sans remise, la taille des échantillons
considérés étant faible par rapport à la taille de la population totale, on
assimile donc les tirages réalisés à des tirages avec remise et on peut alors appliquer
les résultats précédents.
4. Exemple 1
Dans un verger d'orangers, 70% d'oranges sont mûres. Pour
un échantillon de taille 81, n = 81 ≥ 25.
Par ailleurs
p = 0.7 ∈ [0.2; 0.8] . Donc l’intervalle de fluctuation au seuil de 95% sera
5. Exemple 2
On considère l'expérience qui consiste à lancer 100 fois un dé
et à noter le numéro de la face supérieure qui affiche un 3.
Il s'agit bien d'un dé à 6 faces parfaitement équilibré.
Le dé est dit non pipé ou non truqué.
La valeur théorique et admise de la probabilité d'obtenir un 3 est 1/6.
Réaliser l'expérience 100 fois constitue donc un échantillon. La taille de cet échantillon
est égale à n = 100.
p = 1/6 = 0.17 ne vérifie pas la double inégalité:
0.2 ≤ p ≤ 0.8
.
Donc
la définition de l'intervalle de fluctuation au seuil 95% ne
peut être appliquée.
6. Loi des grands nombres
Loi des grands nombres :
Si on répète une expérience aléatoire un très grand nombre de fois, les fréquences de
réalisation de n'importe quel événement se rapprochent et tendent à se stabiliser
autour de la probabilité théorique de l'événement.
Autre façon de le dire:
Les résultats observés ont tendance à se resserrer autour de l'espérance p quand
n augmente.
Ou encore:
Les méthodes statistiques fonctionnent d'autant mieux que l'échantillon est grand.
|