logo

Normalisation

Une grande base de données définie comme une relation unique peut entraîner une duplication des données. Cette répétition des données peut entraîner :

  • Rendre les relations très grandes.
  • Il n'est pas facile de conserver et de mettre à jour les données car cela impliquerait de rechercher de nombreux enregistrements en relation.
  • Gaspillage et mauvaise utilisation de l’espace disque et des ressources.
  • La probabilité d'erreurs et d'incohérences augmente.

Donc, pour résoudre ces problèmes, nous devons analyser et décomposer les relations avec des données redondantes en relations plus petites, plus simples et bien structurées qui satisfont aux propriétés souhaitables. La normalisation est un processus de décomposition des relations en relations avec moins d'attributs.

Qu’est-ce que la normalisation ?

  • La normalisation est le processus d'organisation des données dans la base de données.
  • La normalisation est utilisée pour minimiser la redondance d'une relation ou d'un ensemble de relations. Il est également utilisé pour éliminer les caractéristiques indésirables telles que les anomalies d’insertion, de mise à jour et de suppression.
  • La normalisation divise la plus grande table en plus petites et les relie à l'aide de relations.
  • La forme normale est utilisée pour réduire la redondance de la table de base de données.

Pourquoi avons-nous besoin d’une normalisation ?

La principale raison de normaliser les relations est la suppression de ces anomalies. Le fait de ne pas éliminer les anomalies entraîne une redondance des données et peut entraîner l'intégrité des données et d'autres problèmes à mesure que la base de données se développe. La normalisation consiste en une série de directives qui vous guident dans la création d'une bonne structure de base de données.

Les anomalies de modification des données peuvent être classées en trois types :

    Anomalie d'insertion :L'anomalie d'insertion fait référence au moment où l'on ne peut pas insérer un nouveau tuple dans une relation en raison du manque de données.Anomalie de suppression :L'anomalie de suppression fait référence à la situation dans laquelle la suppression de données entraîne la perte involontaire de certaines autres données importantes.Anomalie de mise à jour :L'anomalie de mise à jour se produit lorsqu'une mise à jour d'une seule valeur de données nécessite la mise à jour de plusieurs lignes de données.

Types de formes normales :

La normalisation passe par une série d’étapes appelées Formes normales. Les formes normales s'appliquent aux relations individuelles. La relation est dite de forme particulièrement normale si elle satisfait des contraintes.

Voici les différents types de formes normales :

Normalisation du SGBD
Forme normale Description
1NF Une relation est en 1NF si elle contient une valeur atomique.
2NF Une relation sera en 2NF si elle est en 1NF et que tous les attributs non clés sont entièrement fonctionnels en fonction de la clé primaire.
3NF Une relation sera en 3NF si elle est en 2NF et qu'aucune dépendance de transition n'existe.
BCNF Une définition plus forte du 3NF est connue sous le nom de forme normale de Boyce Codd.
4NF Une relation sera en 4NF si elle est sous la forme normale de Boyce Codd et n'a pas de dépendance à valeurs multiples.
5NF Une relation est en 5NF. S'il est en 4NF et ne contient aucune dépendance de jointure, la jointure doit se faire sans perte.

Avantages de la normalisation

  • La normalisation permet de minimiser la redondance des données.
  • Meilleure organisation globale de la base de données.
  • Cohérence des données au sein de la base de données.
  • Conception de base de données beaucoup plus flexible.
  • Applique le concept d’intégrité relationnelle.

Inconvénients de la normalisation

  • Vous ne pouvez pas commencer à créer la base de données avant de savoir ce dont l'utilisateur a besoin.
  • Les performances se dégradent lors de la normalisation des relations vers des formes normales supérieures, c'est-à-dire 4NF, 5NF.
  • Il est très long et difficile de normaliser des relations à un degré plus élevé.
  • Une décomposition imprudente peut conduire à une mauvaise conception de la base de données, entraînant de graves problèmes.