logo

Données nominales et ordinales

La science des données s'articule autour du traitement et de l'analyse des données à l'aide d'une gamme d'outils et de techniques. Dans le monde actuel axé sur les données, nous rencontrons des types de données qui nécessitent chacun d’être traités et interprétés. Il est important de comprendre différents types de données pour une analyse appropriée des données et une interprétation statistique. Le type de données détermine les méthodes et opérations statistiques appropriées à utiliser. Différents types de données nécessitent différentes méthodes d’analyse et d’interprétation pour tirer des conclusions significatives. Dans cet article, nous explorerons le concept de données et leur signification, en fournissant des exemples concrets et en vous guidant à travers les façons de les utiliser.

Niveaux de mesure

Avant d’analyser un ensemble de données, il est crucial d’identifier le type de données qu’il contient. Heureusement, toutes les données peuvent être regroupées dans l'une des quatre catégories suivantes : données nominales, ordinales, par intervalles ou par rapport. Bien qu’on les appelle souvent types de données, il s’agit en réalité de différents niveaux de mesure. Le niveau de mesure reflète la précision avec laquelle une variable a été quantifiée et détermine les méthodes qui peuvent être utilisées pour extraire des informations des données.



Les quatre catégories de données ne sont pas toujours simples à distinguer et appartiennent plutôt à une hiérarchie, chaque niveau s’appuyant sur le précédent.

1

Il existe quatre types de données : catégoriques, qui peuvent être divisées en nominales et ordinales, et numériques, qui peuvent être divisées en intervalle et rapport. Les échelles nominales et ordinales sont relativement imprécises, ce qui les rend plus faciles à analyser, mais elles offrent des informations moins précises. D’un autre côté, les échelles d’intervalle et de ratio sont plus complexes et difficiles à analyser, mais elles peuvent potentiellement fournir des informations beaucoup plus riches.



  • Données nominales – Les données nominales sont un type de données de base qui catégorise les données en étiquetant ou en nommant des valeurs telles que le sexe, la couleur des cheveux ou les types d'animaux. Il n’y a aucune hiérarchie.
  • Données ordinales – Les données ordinales impliquent de classer les données en fonction du rang, tel que le statut social, dans des catégories telles que « riche », « revenu intermédiaire » ou « pauvre ». Cependant, il n'y a pas d'intervalles définis entre ces catégories.
  • Données d'intervalle – Les données d'intervalle sont un moyen d'organiser et de comparer des données qui incluent des intervalles mesurés. Les échelles de température, comme Celsius ou Fahrenheit, sont de bons exemples de données par intervalles. Cependant, les données d'intervalle n'ont pas de vrai zéro, ce qui signifie qu'une mesure de zéro peut toujours représenter une mesure quantifiable (comme zéro degré Celsius, qui n'est qu'un autre point sur l'échelle et ne signifie pas réellement qu'il n'y a pas de température présente). .
  • Données de ratio – Le niveau de mesure le plus complexe concerne les données de ratio. Semblable aux données d'intervalle, il catégorise et organise les données en utilisant des intervalles mesurés. Mais contrairement aux données d’intervalle, les données de ratio incluent un véritable zéro. Lorsqu'une variable est nulle, il n'y a pas de présence de cette variable. Une excellente illustration des données de ratio est la mesure de la hauteur, qui ne peut pas être négative.

Que sont les données nominales ?

Les données catégorielles, également appelées données nominales, sont un type d'information crucial utilisé dans divers domaines tels que la recherche, les statistiques et l'analyse des données. Il comprend des catégories ou des étiquettes qui aident à classer et à organiser les données. La caractéristique essentielle des données catégorielles est qu’elles ne possèdent aucun ordre ou classement inhérent parmi leurs catégories. Au lieu de cela, ces catégories sont séparées, distinctes et mutuellement exclusives.

2

Par exemple, les données nominales sont utilisées pour classer les informations en étiquettes ou catégories distinctes sans ordre ni classement naturel. Ces étiquettes ou catégories sont représentées à l’aide de noms ou de termes, et il n’existe aucun ordre ni classement naturel entre elles. Les données nominales sont utiles pour la classification qualitative et l'organisation des informations, permettant aux chercheurs et aux analystes de regrouper des points de données en fonction d'attributs ou de caractéristiques spécifiques sans impliquer de relations numériques.



  • Les catégories de couleurs des yeux comme le bleu ou le vert représentent des données nominales. Chaque catégorie est distincte, sans ordre ni classement.
  • Les marques de smartphones comme iPhone ou Samsung sont des données nominales. Il n’y a pas de hiérarchie entre les marques.
  • Les modes de transport comme la voiture ou le vélo sont des données nominales. Ce sont des catégories discrètes sans ordre inhérent.

Caractéristiques des données nominales

  • Les données classées comme nominales comprennent des catégories complètement distinctes les unes des autres.
  • Les données qui relèvent de la catégorie nominale se distinguent par des étiquettes descriptives plutôt que par une valeur numérique ou quantitative.
  • Les données nominales ne peuvent pas être classées ou ordonnées hiérarchiquement, car aucune catégorie n'est supérieure ou inférieure à une autre.

Exemple

Voici quelques exemples de la manière dont les données nominales sont utilisées pour classer et catégoriser les informations en catégories distinctes et non ordonnées :

1. Couleurs de voiture : Les couleurs des voitures sont des données nominales, avec des catégories claires mais sans ordre ni classement inhérent. Chaque voiture appartient à une seule catégorie de couleurs, sans aucun lien logique ou numérique entre les couleurs.

2. Types de fruits : Les catégories de fruits dans un panier sont nominales. Chaque fruit appartient à une catégorie spécifique sans hiérarchie ni ordre. Toutes les catégories sont distinctes et discrètes.

3. Genres de films : Les genres de films sont des données nominales puisqu'il n'y a pas de classement entre des catégories comme l'action ou la comédie. Chaque genre est unique, mais nous ne pouvons pas dire si l’un est meilleur qu’un autre sur la base de ces seules données.

Que sont les données ordinales ?

Les données ordinales sont une forme de données qualitatives qui classent les variables en catégories descriptives. Il se caractérise par le fait que les catégories qu'il emploie sont classées sur une sorte d'échelle hiérarchique, par exemple du haut au bas. Les données ordinales constituent le deuxième type de mesure le plus complexe, après les données nominales. Bien qu’elles soient plus complexes que les données nominales, qui manquent de tout ordre inhérent, elles restent relativement simplistes.

3

Par exemple, les données ordinales sont un type de données utilisé pour catégoriser les éléments avec une hiérarchie ou un ordre significatif. Ces catégories nous aident à comparer et à classer différentes réalisations, positions ou performances des étudiants, même si les intervalles entre eux ne sont pas égaux. Les données ordinales sont utiles pour comprendre les choix ou préférences ordonnés et pour évaluer les différences relatives.

  • Notes scolaires : les notes comme A, B, C sont des données ordinales, classées par réussite, mais les intervalles entre elles varient.
  • Niveau d'éducation : les niveaux comme le lycée, le baccalauréat et la maîtrise sont des données ordinales, classées par éducation, mais les écarts entre les niveaux diffèrent.
  • Niveau d'ancienneté : les niveaux d'emploi tels que débutant, intermédiaire et supérieur sont des données ordinales, indiquant la hiérarchie, mais l'écart varie selon l'emploi et le secteur.

Caractéristiques des données ordinales

  • Les données ordinales entrent dans la catégorie des données non numériques et catégorielles, mais elles peuvent toujours utiliser des valeurs numériques comme étiquettes.
  • Les données ordinales sont toujours classées dans une hiérarchie (d'où le nom « ordinal »).
  • Les données ordinales peuvent être classées, mais leurs valeurs ne sont pas uniformément réparties.
  • Avec les données ordinales, vous pouvez calculer la distribution de fréquence, le mode, la médiane et la plage de variables.

Exemple

Voici quelques exemples de la façon dont les données ordinales sont utilisées dans les champs et les domaines :

1. Niveaux d’éducation : Les données ordinales sont couramment utilisées pour représenter les niveaux d'éducation, tels que l'école, le baccalauréat, la maîtrise et le doctorat. Ces niveaux ont un ordre.

2. Évaluations de la satisfaction des clients : Une autre application des données concerne les enquêtes de satisfaction client. Ces enquêtes demandent souvent aux répondants d'évaluer leur expérience sur une échelle allant de mauvaise à excellente.

3. Classes économiques : les classes, y compris la classe moyenne et la classe supérieure, peuvent être classées comme données ordinales en fonction de leur classement.

Ces exemples démontrent la manière dont les données ordinales sont utilisées dans tous les champs et domaines.

Données nominales ou ordinaires

Caractéristiques

Données nominales

Données ordinales

Nature des catégories

Distinct et discret

Discret et distinct

Ordre/Classement

Pas d'ordre inhérent

A un ordre ou un classement clair

Valeurs numériques

Aucune valeur numérique significative

Aucune valeur numérique significative

Techniques d'analyse

Nombres de fréquences, pourcentages, graphiques à barres

Classement, médiane, tests non paramétriques, graphiques à barres ordonnées, régression ordinale

Exemple

Couleurs, sexe, types d'animaux

tri des coquilles

Notes scolaires, niveau d'éducation, niveau d'ancienneté

Interprétation

Utilisé pour la classification et le regroupement en fonction de la catégorie

Utilisé pour évaluer les préférences ordonnées, la hiérarchie ou les classements