SERIES STATISTIQUES A UNE VARIABLE

 

 

I - GENERALITES

 

1-1. Définitions

 

- Une statistique est un ensemble de nombres présentés sous forme de tableaux ou de graphiques et concernant un sujet déterminé.

- La statistique est une méthode mathématique d'étude des statistiques définies précédemment.

 

La statistique a pour objet de recueillir des observations portant sur un ensemble de phénomènes comparables, de les traduire au moyen de nombres, de coordonner ces résultats de façon à dégager de leur ensemble certains renseignements.

Elle trouve son application dans de nombreux domaines : en économie, en biologie, dans le commerce et l'industrie, etc.

 

1-2. Les diverses étapes d'une étude statistique

 

·      La collecte des données de base qui comprend :

- la définition précise des renseignements à obtenir.

- l'obtention des renseignements à l'aide de questionnaires présentés à toute la population (recensement) ou à une partie (sondage).

- le classement de ces renseignements et présentation sous forme de tableaux ou de graphiques. 

 

·      L'analyse des données

- Simplification de nombreuses données numériques en les remplaçant par quelques paramètres.

- Décomposition des phénomènes complexes en leurs composants simples.

- Etude des liens entre la variation de deux phénomènes.

 

·      La synthèse de tous les résultats obtenus par l'analyse et leur utilisation pour des prévisions. (ex : météorologiques, économiques, électorales ...).

 

 

1-3. Vocabulaire de la statistique

 

·      Population, membre, échantillon

- L'ensemble des sujets de même nature (hommes, familles, villes, salaires...) que l'on soumet à une étude statistique se nomme population.

 

- Chaque élément de la population est un membre (ou individu ou unité statistique) de cette population.

 

- Un échantillon ( ou lot ) désigne tout sous-ensemble  de cet ensemble.

 

·      Caractère ou variable

- On appelle caractère des éléments d'une population toutes propriétés de ces éléments.

- On distingue des caractères quantitatifs, ( taille, poids, nombres d'enfants...) et des caractères qualitatifs (profession, couleurs...)

 

- Caractère discret, caractère continu.

Un caractère quantitatif peut être discret, ce qui veut dire que les valeurs possibles de ce caractère sont séparées à la façon des entiers naturels. (ex: nombres d'élèves reçus au baccalauréat dans chaque classe d'un collège). Au contraire, si le caractère peut prendre, dans un certain intervalle, n'importe quelle valeur (poids, taille, température...), on dit que le caractère est continu.

 

·      Types de séries statistiques

- Si le caractère étudié est quantitatif, l'énumération des nombres donnant pour chaque membre d'une population la valeur d'un tel caractère est une série statistique quantitative.

 

- Si le caractère étudié est qualitatif, on peut constituer, pour une population donnée, une série statistique qualitative. Chaque variété du caractère est ici non mesurée mais indexée.

 

 

II - PRESENTATION D'UNE SERIE STATISTIQUE

 

2-1. Présentation d'une série statistique (dépouillement)

 

· Simple énumération. Sous sa forme la moins élaborée, une série statistique quantitative se présente comme une énumération de nombres, valeurs du caractère étudié pour la population considérée, dans un ordre quelconque, tel que celui où ces nombres ont été obtenus par l'enquête.

Ex : Voici les notes sur 20 obtenues par 40 élèves d’une classe au cours d’une épreuve 1.

Tableau 1    14-11-16-16-11-09-11-14-12-14-05-17-04-07-10-13-12-16-08- 
         09-17-11-18-10-14-17-13-04-08-04-20-13-14-17-20-10-20-19-20-10

 

·      Classement par valeurs croissantes

Le classement des valeurs du tableau 1 donne :

04-04-04-05-07-08-08-09-09-10-10-10-10-11-11-11-11-12-12-13-

13-13-14-14-14-14-14-16-16-16-17-17-17-17-18-19-20-20-20-20

 

Si l'effectif total est assez petit, ce classement peut fournir d'emblée certains renseignements. Par exemple, les valeurs extrêmes du caractère choisi sont 4 et 20, l'étendue est donc 16. On peut observer que les valeurs 10, 11, 14, 17 et 20 sont relativement fréquentes

 

·      Tableaux d'effectifs de valeurs discrètes

Il est possible d'établir à partir des valeurs du tableau 1, difficiles à analyser telles quelles, un tableau résumé plus clair. On présente le tableau sous forme de tableau à 2 colonnes (ou à 2 lignes).

 

Si la variable prend les valeurs distinctes x1, x2, … , x N d'effectifs correspondants n1, n2,…,nN, la série notée (xi, ni) est présentée par le tableau suivant :

 

Valeur du caractère  xi

x1

x2

. . .

xi

. . .

xN

Effectif   ni

n1

n2

. . .

ni

. . .

nN

 

Pour noter le dépouillement manuellement, on dessine souvent un carré, côté après côté.

 

Notes

dépouillement

Nombre d'élèves

 

Notes

dépouillement

nombre d'élèves

1

2

3

4

5

6

7

8

9

10

 

 

 

11

12

13

14

15

16

17

18

19

20

 

 

Tableau 2 : répartition des notes des élèves d'une classe

 

Complétez le tableau 2 avec les données du tableau 1.

 

2-2. Vocabulaire

 

On considère une série statistique quantitative (xi , ni).

- Etendue d'une série : c'est la différence entre la plus grande et la plus petite des valeurs du caractère effectivement obtenues.

- Effectif total : c'est le nombre N d'éléments de la population.

- Effectif : dans le cas d'un caractère discret, c'est le nombre ni des membres de la population présentant une certaine valeur du caractère.

Remarque : La somme des effectifs est égale à l'effectif total.

- Fréquence d'une valeur : c'est le rapport de l'effectif de cette valeur à l'effectif total.

Citons les propriétés suivantes :

            - la fréquence d'une valeur est comprise entre 0 et 1.      .

            - la somme des fréquences est égale à 1. .

- Pourcentage : En multipliant par 100 la fréquence, on obtient le pourcentage.

pourcentage (de la valeur x i) = f i . 100%

 

2-3. Cas d'une série classée

Si les valeurs distinctes du caractère sont nombreuses, on les groupe par classes. On peut faire divers regroupements par classes. Par exemple :

 

notes  xi

] 0, 2 ]

] 2, 4 ]

] 4, 6 ]

] 6, 8 ]

] 8,10]

]10,12]

]12,14]

]14,16]

]16,18]

]18,20]

nombre d'élèves  ni

 

 

 

 

 

 

 

 

 

 

Tableau 3. Groupement par classe des notes de l'épreuve 1

 

Effectuez un regroupement par classe d'amplitude 4 de la série du tableau 1.

 

Remarques :

- On choisit les classes, pas trop nombreuses pour que le tableau soit clair mais suffisamment pour qu'il n'y ait pas perte d'information.

- Il importe que les classes recouvrent tous les résultats et aient une intersection vide.

- Il n'est obligatoire que les classes soient de même amplitude.

 

Vocabulaire

Considérons, par exemple, la classe ] x i , x i+1 ]

- les limites de cette classe sont x i et x i+1.

- le centre est la demi-somme     

- l’étendue (ou amplitude) est la différence x i+1 - x i.

- l’effectif  n i est la somme des effectifs des valeurs appartenant à cette classe.

- La fréquence f i de cette classe est :     

 

2-4. Tableaux d'effectifs cumulés, de fréquences cumulés

 

Pour certains usages, il est commode d'indiquer, pour chaque valeur du caractère au lieu des effectifs qui lui correspond, la somme des effectifs de cette valeur et de toutes celles qui précédent. On l'appelle effectif cumulé.

 

Par définition :

- l'effectif cumulé croissant de la valeur xi est la somme des effectifs des valeurs x1, x2, … , x i i.e. n1+n2+…+ni.

- la fréquence cumulée croissante de la valeur xi est la somme  f1+f2+…+fi.

- Effectifs cumulés décroissants

On appelle effectif cumulé décroissant de la valeur xi le nombre

N - ( n1+n2+…+ni)

 

Caractère x i

Effectif n i

Effectif cumulé

 

Caractère x i

Effectif n i

Effectif cumulé

4

5

6

7

8

9

10

11

12

3

1

0

1

2

2

4

4

2

 

 

13

14

15

16

17

18

19

20

3

5

0

3

4

1

1

4

 

 

Tableau 4. Effectifs cumulés des notes de l'épreuve 1.

 




 

III - GRAPHIQUES

 

Les représentations graphiques ont pour objet essentiel de rendre visible globalement les données des tableaux.

 

3-1. Cas d'une série à caractère quantitatif

 

On porte en abscisse les valeurs du caractère, et en ordonnée l’effectif ou la fréquence.

- Dans le cas d’une variable discrète, le graphique représentant la répartition est un diagramme en bâtons : l’effectif (ou la fréquence) est représenté par un segment de droite.

En joignant les sommets des bâtons, on obtient le polygone des effectifs.

 

 

 

- Dans le cas d’une série classée ou variable continue, le graphique est appelé histogramme.

Les intervalles des classes servent de base à des rectangles dont les aires sont proportionnelles aux effectifs.

La pyramide des âges est une version de l'histogramme.

 

3-2. cas d'une série à caractère qualitatif

 

Il n'est pas possible d'utiliser un diagramme cartésien, puisque les données ne sont pas numériques. Diverses méthodes sont possibles ; nous indiquerons certaines d'entre elles, à partir de l'exemple suivant.

 

Tableau 5 : langues vivantes choisies au bacc.

 

 

Term. A

Term. C

Anglais

20

23

Allemand

15

8

Espagnol

5

4

TOTAL

40

35

 

Diagramme à bandes

Deux sortes de diagrammes sont possibles :

- deux bandes d'égales largeurs représentent les deux classes de Terminale, la hauteur représentant chaque langue étant proportionnelle au pourcentage. L'axe des ordonnées reste significatif. Celui des abscisses n'est tracé que pour donner un point de départ assuré aux bandes.

 

- On peut également représenter les effectifs par des bandes de même largeur, et de longueurs proportionnelles à ces effectifs ou à ces fréquences.

 

 

Diagramme à secteurs (camenbert)

Il est également possible de réaliser des diagrammes à secteurs ; les effectifs ou les fréquences des diverses modalités sont représentés par des secteurs d'un cercle ou d'un demi-cercle.

Les diagrammes à secteurs ont à peu près les mêmes avantages que les diagrammes à bandes du premier type décrit ci-dessus.

D'autres diagrammes sont également possibles, par exemple les diagrammes figuratifs et les diagrammes polaires.

 

 

3-3. Autres graphiques

 

Il existe d'autres graphiques, comme la pyramide des âges, le diagramme polaire (séries chronologiques). Dans les diagrammes à figurines, les diagrammes géographiques c'est l'aspect visuel qui est le plus recherchée et non la précision.