Le vocabulaire de base est issu en grande partie du premier domaine d'intervention des statistiques : la démographie.
Population :
Tout ensemble $W = \{ w_1, w_2, \cdots,w_p\}$ soumis à une étude statistique.
Individu ou unité statistique :
tout élément $w_i$ de la population. Il peut être abstrait ou concret.
Caractère :
Aspect ou modalité ou trait déterminé commun à tous les individus. On le note C.
On appelle E l'ensemble des modalités. Le caractère peut être :
- soit qualitatif :
Il n'est pas mesurable.
On peut distinguer
- le caractère qualitatif nominal
Exemples :
W ={population}, C = couleur des yeux, E = {Noir, Gris, Marron,Bleu, Vert, Autres}
W ={entreprises}, C = catégorie, E = {textile, sidérurgique,travaux publics, Autres}
W ={population}, C = sexe, E = {féminin, masculin}
- le caractère qualitatif ordinal .
Les modalités sont ordonnées.
Exemples :
W ={produits archéologiques}, C = qualité, E = {nulle, faible, moyenne, bonne, excellente}
W ={accusés}, C = type de délit, E = {mineur, assez grave, grave, très grave} - soit quantitatif :
On peut le mesurer. On parle aussi de variable statistique.
On distinguer :
- le caractère quantitatif discret :
Le caractère ne peut prendre que certaines valeurs particulières : des entiers relatifs.
Par exemple : le nombre d'enfants d'une famille (qui est un entier naturel)
-le caractère quantitatif continu :
Le caractère peut prendre des valeurs réelles quelconques. Si nous prenons 2 valeurs quelconques de la variable aussi rapprochées soient-elles, il existe toujours une infinité de valeurs comprises entre elles.
Par exemple : la taille, le poids,...
Sur une population W, un caractère qualitatif C a un ensemble E de modalités qu'on peut coder à l'aide d'une application f et l'on obtient un caractère quantitatif discret C' avec un esemble E' de modalités.
Exemple :
W = {population}, C = sexe, E = {F(éminin), M(asculin)}. On code F par 1 et M par 2.
f(F) = 1 et f(M) = 2. Alors E' = {1, 2} et C' = sexe est devenu quantitatif discret.
Effectif :
Le nombre $n_i$ d'individus correspondant à une même valeur (classe ou modalité) d'un caractère s'appelle l'effectif de la valeur.
Effectif total :
$N = n_1 + n_2 + \cdots + n_p$
Fréquence :
$f_i = \frac{n_i}{N}$