Vocabulaire

Le vocabulaire de base est issu en grande partie du premier domaine d'intervention des statistiques : la démographie.

Population :

Tout ensemble $W = \{ w_1, w_2, \cdots,w_p\}$ soumis à une étude statistique.

Individu ou unité statistique :

tout élément $w_i$ de la population. Il peut être abstrait ou concret.

Caractère :

Aspect ou modalité ou trait déterminé commun à tous les individus. On le note C.
On appelle E l'ensemble des modalités. Le caractère peut être :

  • soit qualitatif :
    Il n'est pas mesurable.
    On peut distinguer
    - le caractère qualitatif nominal
    Exemples :
    W ={population}, C = couleur des yeux, E = {Noir, Gris, Marron,Bleu, Vert, Autres}
    W ={entreprises}, C = catégorie, E = {textile, sidérurgique,travaux publics, Autres}
    W ={population}, C = sexe, E = {féminin, masculin}
    - le caractère qualitatif ordinal .
    Les modalités sont ordonnées.
    Exemples :
    W ={produits archéologiques}, C = qualité, E = {nulle, faible, moyenne, bonne, excellente}
    W ={accusés}, C = type de délit, E = {mineur, assez grave, grave, très grave}
  • soit quantitatif :
    On peut le mesurer. On parle aussi de variable statistique.
    On distinguer :
    - le caractère quantitatif discret :
    Le caractère ne peut prendre que certaines valeurs particulières : des entiers relatifs.
    Par exemple : le nombre d'enfants d'une famille (qui est un entier naturel)
    -le caractère quantitatif continu :
    Le caractère peut prendre des valeurs réelles quelconques. Si nous prenons 2 valeurs quelconques de la variable aussi rapprochées soient-elles, il existe toujours une infinité de valeurs comprises entre elles.
    Par exemple : la taille, le poids,...

Sur une population W, un caractère qualitatif C a un ensemble E de modalités qu'on peut coder à l'aide d'une application f et l'on obtient un caractère quantitatif discret C' avec un esemble E' de modalités.
Exemple :
W = {population}, C = sexe, E = {F(éminin), M(asculin)}. On code F par 1 et M par 2.
f(F) = 1 et f(M) = 2. Alors E' = {1, 2} et C' = sexe est devenu quantitatif discret.

Effectif :
Le nombre $n_i$ d'individus correspondant à une même valeur (classe ou modalité) d'un caractère s'appelle l'effectif de la valeur.

Effectif total :
$N = n_1 + n_2 + \cdots  + n_p$

Fréquence :
$f_i = \frac{n_i}{N}$