Conversions    
 
  Probabilités    
 
  Les brevets   
 
  Statistiques    
 
  révisions 1   
 
  révisions 2   
 
  Units   
 
  home  
 
  ask us  
 


Maths
- 2 -



© The scientific sentence. 2010


Mathématiques 2: Statistiques:
Classes et histogrammes




1. Définitions

Une série statistique ou série de données est appelé aussi distribution statistique ou distribution de données.

Certaines distributions de données peuvent être très longues. Ainsi, il est nécessaire de condenser ces données sous une forme de classes plus favorable à l’analyse statistique.

Lorsqu’une distribution comporte un nombre de données répétées, il convient de les placer dans un tableau à données condensées.

Les tableaux de distribution et les diagrammes sont des outils qui permettent de mieux comprendre une étude statistique du phénomène considéré.



2. Données condensées

Exemple


On ceuille 24 mandarines et on les pèse une par une.

Nous avons la liste de données qui représente les masses des mandarines en grammes:

102, 100, 105, 103, 103, 105, 105, 98, 99, 105,
102, 99, 101, 103, 102, 103, 101, 102, 102, 99,
102, 102, 98, 102.

Le tableau des données condensées:

masse (g) effectif
98 2
99 3
100 1
101 2
102 8
103 4
105 4

La première colonne indique le caractère de l’étude ou les données, c'est à dire la masse.

La deuxième colonne indique le nombre de fois que la donnée se répète, c'est à dire l'effectif.

24 est le nombre total de données.



3. Données groupées en classes

3.1. Définitions

Lorsque les données de la distribution sont nombreuses, on les divise en classes.

On ecrit la liste des données en ordre croissant, en rassemblant les effectifs, puis on regroupe toutes ces données en classes.

Pour déterminer les classes:

- On calcule l’étendue : max – min

- On détermine le nombre de classes
Il n’y a pas de règle stricte pour fixer le nombre de classes, on compte habituellement entre 5 et 10 classes.

- On étermine la largeur des classes. C'est le rapport entre l’étendue et le nombre de classes retenues. Toutes les classes doivent avoir la même largeur.

Chaque classe débute par un crochet fermé et se termine par un crochet ouvert. Le crochet fermé indique un élément inclus, le crochet ouvert indique un élément exclus,

- On regroupe dans un tableau de données en classes.


Lorsque les données sont groupées en classes:

- Les modes sont remplacés des classes modales. Il s’agit des classes possédant le plus d’effectifs.

- On estime la médiane au milieu de la classe médiane.

- On estime la moyenne à la somme des produits des milieux des classes par leur effectif / total des effectifs


Le milieu d'une classe est égal à la demi-somme de son élément inclus + son élément exclus.

Le milieu de chacune classe est égal au milieu de sa classe précédente augmenté de la largeur de la classe.



3.2. Exemple


On ceuille de nouveau 30 mandarines, puis on les pèse au centième près. Nous avons:

102.45, 100.00, 103.95, 105.22, 103.28, 103.28, 105.45, 105.10, 99.55, 105.22, 102.25, 99.10, 101.95, 104.25, 105.05, 100.05, 100.85, 102.00, 103.00, 101.95, 102.45, 102.25, 99.55, 102.24, 102.12, 104.35, 105.65, 103.65, 105.10,104.25.


Le tableau I représente les données condensées:

Tableau I
masse (g) effectif
99.10 1
99.55 2
100.00 1
100.05 1
100.85 1
101.95 2
102.00 1
102.12 1
102.24 1
102.25 2
102.45 2
103.00 1
103.28 2
103.65 1
103.95 1
104.25 2
104.35 1
105.05 1
105.10 2
105.22 2
105.45 1
105.65 1
Total 30
    


L'étendue est égale à:
105.65 - 99.10 = 6.55

On va prendre 5 classes.

La largeur , ou l'amplitude est donc égale à 6.55/5 = 1.31.

On augmente légèrement l'amplitude de cet intervalle afin de s'assurer que la plus grande valeur soit incluse dans la dernière classe. Donc, on peut la hausser à 1.35.

Voici les 5 classes:

[99.10, 100.45[, [100.45, 101.80[, [101.80, 103.15[, [103.15, 104.50[, [104.50, 105.85[.

Groupées dans un tableau (Tableau II) avec leurs effectifs respectifs:

Tableau II
classes (g) effectif
[99.10, 100.45[ 5
[100.45, 101.80[ 1
[101.80, 103.15[ 10
[103.15, 104.50[ 7
[104.50, 105.85[ 7
Total 30


La classe modale est donc [101.80, 103.15[ .

Le mode est estimé à (101.80 + 103.15)/2 = 102.475.

L'effectif total est N = 30 , N/2 = 15. La médiane est donc la moyenne de la 15e et 16e données qui se trouvent toutes les deux dans la classe [101.80, 103.15[.

La classe médiane est donc [101.80, 103.15[.

La médiane est estimée au milieu de la classe médiane; c'est à dire: (101.80 + 103.15)/2 = 102.475.

La moyenne est éstimée à:

[5 x (99.10 + 100.45)/2 + 1 x (100.45 + 101.80)/2 + 10 x (101.80 + 103.15)/2 + 7 x (103.15 + 104.50)/2 + 7 x (104.50 + 105.85)/2]/30 = 102.92 g.



4. Histogramme

4.1. Définitions

L’histogramme est la représentation graphique d’un tableau de données groupées en classes.

Les classes sont placées sur l’axe des abscisses.
Les effectifs sont placés sur l’axe des ordonnées.


Dans un histogramme, on mentionne le titre. Si la première classe ne commense pas par zéro, on fait une coupure d’axe (-//-).



4.2. Exemple

Histogramme des masses des 30 mandarines:



Diagramme circulaire (camembert) :








  


Google
  Web ScientificSentence


SVT
|
chimie labs
|
Physics and Measurements
|
Probability & Statistics
|
Combinatorics - Probability
|
Chimie
|
Optics
|
contact
|


© Scientificsentence 2013. All rights reserved.