Maths - 2 -
Statistiques
© The scientific sentence. 2010
|
|
Mathématiques 2: Statistiques
Définitions
Méthodes d'échantillonnage
Sources de biais
1. Définitons
• Une base de sondage est une liste des
individus à partir de laquelle on prélève un
échantillon.
Cette liste détermine la population observée.
Exemple: l'annuaire téléphonique en est un bon exemple.
• Une unité statistique est l'individu.
Il existe 4 techniques d'échantillonnage aléatoire
différentes:
• La population des individus c'est la
base de sondage des unités statistiques.
• Le caractère c'est la valeur ou la donnée
dans une série statistique.
• Caractère qualitatif
La donnée est une expression . Exemple:
la couleur des yeux, la langue maternelle, le genre, ...
• Caractère quantitatif
La donnée est un nombre. Selon la nature de ce nombre,
cette variable sera discrète ou continue.
• Caractère quantitatif discret
La donnée est un nombre naturel.
Exemple: nb d'enfants dans une famille, nb d'amis, nb
de voitures, ...
• Caractère quantitatif continu
La donnée peut prendre n'importe quelle valeur
dans un intervalle donné.
Exemple: la taille d'une personne, le temps, le
poids, ...
Le recensement est une recherche d'information
qui s'adresse à toute la population visée par l'étude.
Le sondage est une recherche d'information qui s'adresse
à une partie de la population, appelée échantillon, dont
la composition est choisie selon des méthodes d'échantillonnage.
Une enquête; est généralement réalisée par un expert;
comme un scientifique, un chercheur, ou un médecin .
Lorsque les données concernent des objets et non des êtres
vivants, il sera question d'un inventaire.
2. Méthode d'échantillonnage
2.1 L'échantillonnage aléatoire
L'échantillonnage aléatoire simple consiste à
choisir des individus au hasard parmi la base de sondage.
Procédure :
• Numéroter les unités statistiques de 1 à N,
N est la taille de la population.
• Tirer au hasard des unités statistiques de la population qui
feront partie de l'échantillon.
• Il faut tirer un nombre d'unités statistiques égal à la taille
de l'échantillon.
2.2 L'échantillonnage aléatoire
systématique
L'échantillonnage aléatoire systématique est une technique
où les unités statistiques sont choisis à intervalle régulier
dans la base de sondage.
Procédure :
• Numéroter les unités statistiques de 1 à N,
N est la taille de la population.
• Calculer l'intervalle de sélection que l'on appelle
aussi le pas de sondage.
On le calcule en divisant la taille totale de
la population N par la taille de l'échantillon n,
soit:
pas de sondage S = N/n
= (taille totale de
la population)/(taille de l'échantillon)
• Tirer au hasard une unité statistique de la population qui
fera partie de l'échantillon.
• Tirer les autres unités en appliquant le pas de sondage ;
celles-ci feront également partie de l'échantillon.
Prendre Une, puis la Seme, 2S eme, 3Seme, ... (N-S)eme.
Chaque élément qui compose l'échantillon est choisi de façon
régulière, selon un intervalle régulier,
à l'intérieur de la population ciblée.
Exemple: À la porte d'un musée, on demande à chaque 10
(échantillon) qui sortent du musée leur opinion.
2.3 L'échantillonnage aléatoire
stratifié
L'échantillonnage aléatoire stratifié
suppose que la population peut être divisée en groupes
distincts tels que la taille, le genre, l'âge, etc...
Ces différents groupes sont appelés des strates.
Une strate est un sous-ensemble de la population
ayant des caractéristiques communes, donc des
sous-ensembles homogènes.
Cette méthode consiste à prélever un échantillon ayant la
même composition que la population ce qui crée un échantillon
représentatif.
Procédure :
• Diviser la population en strates.
• Dresser la liste la plus complète possible
(base de sondage) constituant chacune des strates.
• Pour chaque strate, choisir de façon aléatoire simple un
nombre d'unités statistiques pour constituer l'échantillon
de telle sorte que le pourcentage d'unités dans chacune des
strates de l'échantillon soit le plus près possible du pourcentage
d'unités dans chacune des strates de la population.
2.4 L'échantillonnage aléatoire
par grappes
L'échantillonnage aléatoire par grappes consiste à choisir
des groupes (toute une grappe de raisin) plutôt que de choisir
des unités statistiques isolées (un seul raisin).
Une grappe est un sous-ensemble non homogène
de la population.
Par exemple, un ensemble de classes, d'une même école, ou
des habitants du même immeuble.
Procédure :
• Diviser la population en grappes.
• Dresser la liste la plus complète possible (base de sondage)
des unités statistiques formant chacune des grappes.
• Choisir de façon aléatoire simple un certain nombre de
grappes.
• L'échantillon sera alors composé de toutes les unités statistiques
appartenant aux grappes choisies.
3. Les techniques d'échantillonnage
non aléatoire
Les techniques d'échantillonnage non aléatoire sont
plus rapides et plus simples.
Il est par contre, peu recommandé de généraliser les
résultats provenant de ces méthodes à l'ensemble de la
population, puisque toutes les unités statistiques n'ont
pas la même chance d'être choisi ce qui influence la
représentativité de l'échantillon.
Il existe 4 méthodes différentes.
3.1. L'échantillonnage accidentel
L'échantillonnage accidentel est une technique simple et
peu coûteuse. L'unité statistique se passe au hazard à un endroit
et à un moment .
Par exemple, on se place au bord d'une rue et on
compte les voitures de couleur rouge qui passent.
3.2. L'échantillonnage par volontaire
L'échantillonnage par volontaire est une des méthodes les
plus utilisées. Les unités statistiques décident de faire partie de
l'étude de leur propre gré.
3.3. L'échantillonnage par quotas
L'échantillonnage par quotas est la technique selon laquelle
on respecte les proportions de la population, mais on choisit
les individus de façon accidentelle.
Exemple: questionner 10 filles et 12 garçons afin de
respecter la proportion de chacun des sgenres dans le cégep.
Procédure :
• Diviser la population en catégories homogènes.
• Pour chaque catégorie, choisir de façon accidentelle un
nombre d'unités statistiques pour constituer l'échantillon
de telle sorte que le pourcentage d'unités dans chacune
des catégories de l'échantillon soit le plus près possible du
pourcentage d'unités dans chacune des catégories de la population.
3.4. L'échantillonnage au jugé
L'échantillonnage au jugé est une technique basée
uniquement sur les connaissances du chercheur sur la population.
Le chercheur choisit les unités statistiques qu'il juge possédant
les caractéristiques typiques de la population à l'étude.
4. Les sources de biais
Lorsqu'un recensement, une enquête ou un sondage est effectué,
plusieurs facteurs peuvent venir fausser ses résultats.
Ces erreurs sont nommées biais et peuvent provenir de n'importe
quelle étape du processus de recherche d'informations.
Afin de les éviter, voici une liste des sources de biais les plus
fréquentes.
• Taille de l'échantillon
Pour faire en sorte que l'échantillon soit représentatif de
la population, il est important que la taille de l'échantillon
soit raisonnable lorsqu'elle est comparée à la taille de la population ciblée.
• Caractéristiques de l'échantillon
Tout comme la taille de l'échantillon, il est important que
les caractéristiques de ce dernier reflètent celles de la population.
Avant de débuter une enquête, il est important d'en savoir un maximum
sur la population ciblée afin de construire un échantillon qui lui ressemble.
• Formulation des questions
Lorsque vient le temps de composer les questions du sondage, il est
important de garder une position neutre par rapport au sujet et d'être
le plus concis possible.
• Attitude de l'enquêteur
Toujours dans le but d'avoir la réponse la plus honnête possible,
il est important que l'enquêteur n'appuie pas ouvertement sa démarche
par des arguments ou par une attitude qui pourraient influencer les répondants.
• Confidentialité des résultats
Afin d'émettre leur point de vue le plus sincère, certains des répondants
ont besoin de savoir que leurs réponses et identité seront gardées confidentielles. En ce sens, personne ne pourra les utiliser pour revenir contre eux à court ou long terme.
• Lieu et moment
Afin de s'assurer d'un bon taux de réponses, il est important de choisir
un lieu et un moment opportuns dans la journée pour aborder les répondants.
• Faible taux de réponses
Lors de l'analyse des résultats, l'enquêteur doit récolter assez de données
afin de dresser un juste portrait de l'opinion des gens. Pour ce faire, il doit
faire tout en son possible pour que les répondants complètent le sondage adéquatement.
• Fiabilité des réponses
Il peut arriver que certains répondants fournissent des réponses qui n'ont
aucun sens dans le but de compléter le sondage le plus vite possible;
malgré toute la bonne volonté de l'enquêteur.
• Représentation des résultats
À cette étape de l'enquête, il est important de bien présenter le portrait
global des résultats.
En d'autres mots, il faut éviter d'isoler un résultat dans le but de créer du sensationnalisme ou pour propager une fausse opinion publique.
|
|