STATISTIQUE

           

I-         GENERALITES :

 

         1.- Vocabulaires :

a.- Population - Variable

Effectuer une étude statistique consiste à collecter, organiser et exploiter des informations sur un ensemble appelé population, délimité par une propriété commune.

Cette population est constituée d'individus ou unités statistiques, qui peuvent être des objets, des idées, des êtres vivants…

La propriété étudiée est appelée variable ou caractère.

Le caractère est qualitatif lorsque les valeurs prises ne sont pas des nombres, et quantitatif, lorsque les valeurs prises sont des nombres.

Un caractère quantitatif peut être discret si les valeurs prises sont isolées, ou continu s'il peut prendre toutes les valeurs possibles d'un intervalle.

 

b.- Effectifs – Fréquence- Classes

L'effectif total est le nombre d'individus de la population.

On note en général x1, x2, …, xn les valeurs prises par la variable étudiée et ni le nombre d'individus sur lesquels on a observé la valeur xi. ni est appelé effectif de la valeur xi de la variable.

La série statistique ainsi définie se note (xi , ni).

L'effectif total est alors .

Le rapport est appelé fréquence de xi.

On a :

o           quel que soit i

o         

o          100.fi donne le pourcentage des individus ayant le caractère xi.

                                           

Lorsque le caractère est continu, on ne peut pas considérer chaque valeur séparément, on regroupe alors ces valeurs par classe.

De même lorsque l'effectif est assez important, il est plus commode de regrouper les valeurs par classe.

 

Exemple :

      La population étudiée est l'ensemble des élèves d'une classe. Le caractère    étudié est la note obtenue lors d'un certain examen.

       Les notes obtenues sont :

 

                   12  12  14   5   8   8  9  16  15  7   6       10   10  12   9   9   10   7   6  10  11  9  7  9   11

 

       Ecrivons cette série de notes dans l'ordre croissant :

      5   6  6  7  7  7  8  8  9  9  9  9  9  10  10  10  10  11  11  12  12  12  14 15  16

 

On voit que 1 élève a eu 5, deux ont eu 6, …. On peut réécrire cette série sous forme de tableau :

 

Notes

5

6

7

8

9

10

11

12

13

14

15

16

effectifs

1

2

3

2

5

4

2

3

0

1

1

1

 

 

Effectifs cumulés – Fréquences cumulées

Considérons une série à caractère quantitatif xi. On ordonne les valeurs dans l'ordre croissant : x1 < x2 <…< xk.

Si ni est l'effectif de la valeur xi, on appelle effectif cumulé croissant jusqu'à la ie  valeur le nombre : c'est le nombre des individus présentant une modalité inférieure à xi .

 

 

Notes

5

6

7

8

9

10

11

12

13

14

15

16

effectifs

1

2

3

2

5

4

2

3

0

1

1

1

Effectif cumulé

1

3

6

8

13

17

19

22

22

23

24

25

 

Ce tableau nous donne le nombre d'élèves qui ont eu une note inférieure à une note donnée. Par exemple, 6 élèves ont eu une note inférieure ou égale à 7, 13 n'ont pas eu la moyenne…

 

On définit de même

-          la fréquence cumulée croissante :  où N est l'effectif total de la population

 

Notes

5

6

7

8

9

10

11

12

13

14

15

16

effectifs

1

2

3

2

5

4

2

3

0

1

1

1

Fréquences

0,04

0,08

0,12

0,08

0,2

0,16

0,08

0,12

0

0,04

0,04

0,04

Fréquences cumulées

0,04

0,12

0,24

0,32

0,52

0,68

0,76

0,88

0,88

0,92

0,96

1

 

 

         2.- Diagrammes

Un diagramme est une représentation graphique de la série. Il permet de visualiser ensemble les données statistiques.

 

a) Diagramme à bandes. Diagramme à bâtons

On porte en abscisses les valeurs de la variable x et en ordonnées les effectifs. Les effectifs sont représentés par des rectangles (bandes) verticales de longueurs proportionnelles aux effectifs. On peut remplacer les bandes par des segments : on obtient un diagramme en bâtons.

 

b) Diagramme à une seule bande.

La longueur d'une bande est partagée proportionnellement aux effectifs ou aux fréquences.

 

Exemple : Voici la production agricole annuelle d'une certaine commune rurale :

 

Produit

Riz

Manioc

Fruits

Légumes

Autres

Quantité

 (en tonne)

85

60

25

40

13

        

              

c) Diagramme à secteur

      C'est un diagramme de même type que le diagramme à une seule bande.        Le disque est partagé en secteurs dont les angles sont proportionnels aux    effectifs.

 

Zone de Texte:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

                    Diagramme à une seule bande.                                        Diagramme à secteur

 

 

 

     

 d)  Histogrammes : Cas d’une série continue ou série classée.

On porte en abscisses les valeurs de la variable x et en ordonnées les effectifs. L'effectif est représenté par un rectangle dont la base est égale à l'étendue de la classe et la hauteur proportionnelle à l'effectif.

 

Exemple

Dans l'exemple précédent, regroupons les notes en classes d'amplitude 2

On obtient le tableau suivant :

Notes

[4 ; 6 ]

]6 ; 8 ]

] 8 ; 10 ]

] 10 ; 12 ]

] 12 ; 14 ]

]14 ; 16 ]

Effectifs

3

5

9

5

1

2

 

 

                   

 

 

 

Polygones des effectifs

   En reliant les extrémités des bâtons, on obtient le polygone des effectifs.

   Dans le cas des histogrammes, on prend les centres des classes. 

 

 

 

II-               CARACTÉRISTIQUES D'UNE SÉRIE STATISTIQUE

 

Un caractéristique est une grandeur qu'on utilise pour résumer une série statistique.

On distingue deux sortes de caractéristique : caractéristiques de position et caractéristiques de dispersion.

                 1.- Caractéristique de position

a) le mode :

Le mode ( ou dominante) est la valeur la plus fréquente de la variable. C'est  la variable qui a le plus grand effectif.

Le mode est défini même si la variable est qualitative.

Pour une série classée, dont les classes sont d'égal effectif, la classe modale est la classe qui correspond au plus grand effectif.

Si une série peut posséder un seul mode on dit qu'elle est unimodale. Si elle en possède plusieurs, on dit qu'elle est plurimodale.

 

b) la moyenne :

·              Définition :

La moyenne arithmétique d'une série statistique est égale à la somme des valeurs du caractère divisées par leur nombre.

 

i- Cas des données énumérées :  

ii- si la série est donnée par sa distribution d'effectifs, les valeurs x1, x2, …, xn ayant respectivement pour effectifs n1, n2, ..,nk , alors :

iii- Cas où les valeurs sont regroupées en classes : les ni valeurs de la
i-ème classe sont supposées groupées au centre xi de la classe. On revient ainsi au cas précédent.

 

 Remarque :

       

         Donc si fi est la fréquence de la variable xi alors :

                                       

 

    

 

·              propriétés ( à établir en exercice) :

-               Soit une série statistique sur une population et une partition de cette population en deux sous-populations d'effectifs respectifs n1 et n2. Si m1 et m2  sont les moyennes respectifs des deux sous-populations, alors la moyenne de la population est

-               Si  est la moyenne de la série ,

Ø    alors la moyenne de la série  est

Ø    la moyenne de la série  est

 

         Donc , si on pose  alors la moyenne de la série  est     

 

c) la médiane  :

·              définition :

C'est la valeur de la variable qui partage la population en deux parties de même effectif : c'est donc la valeur M de xi telle que la moitié au plus des valeurs des xi soient  inférieures à M et la moitié au plus des valeurs de xi supérieure à M

 

 

 

·              Détermination de la médiane :

o       Cas d'une série discrète

On range dans l'ordre croissant les valeurs de la variable, chaque valeur étant écrite autant de fois qu'elle est prise :

- si le nombre de valeurs est impair, la médiane est la valeur du milieu

- si le nombre de valeurs est pair, on peut prendre comme médiane tout valeur comprise entre les deux valeurs au centre. Par convention, on prend la demi somme de ces deux valeurs : si xi et xi+1 sont les valeurs au centre.

 

Exemple :

 

5      6   6  7  7  7  8  8  9  9  9  9  9  10  10  10  10  11  11  12  12  12  14 15  16

                                                             

                                                                M

 

 

o       Cas d'une série classée :

On trace le polygone des effectifs cumulés croissants  et celui des effectifs cumulés décroissants. La médiane M est le l'abscisse du point d'intersection de ces deux courbes.

Un autre manière de la déterminer est de tracer le polygone des effectifs cumulés (ou fréquence cumulées) et la droite d'équation où N est l'effectif total de la population. La médiane est l'abscisse du point d'intersection de cette droite avec le polygone.

 

 

 

2.- Caractéristique de dispersion.

Une caractéristique de dispersion est utilisée pour évaluer la dispersion d'une série. On utilise le plus souvent la variance et l'écart type .

 

Variance. Ecart type

 

·              Définition

La variance d'une série est la moyenne des carrés des écarts à la moyenne.

 

 

L'écart type d'une série est la moyenne quadratique des écarts à la moyenne. C'est la racine carrée de la variance :  

 

                                          

 

·              Remarques.

Plus la variance est grande, plus la série est dispersée.

Plus la variance est petite (voisin de 0), pus la série est resserrée autour de la moyenne.

La variance  est une quantité positive ou nulle.

 

·              Méthode de calcul

Même avec des valeurs observées xi très simples, il arrive souvent que la moyenne  soit un nombre décimal. Dans ce cas, le calcul de la variance V nécessite des calculs fastidieux.

La formule de Koenig :        (que vous allez démontrer en exercice) permet de simplifier les calculs.

 

·              Propriétés ( à établir en exercice):

-         La variance et l'écart-type de la série  sont indépendants de a :

           ce sont respectivement la variance et l'écart-type de

-         Si la variance et l'écart-type de la série sont respectivement V et , alors la série  a pour variance  et pour écart-type