Normalisation

Définition - Que signifie la normalisation?

La normalisation est le processus de réorganisation des données dans une base de données afin qu'elle réponde à deux exigences de base:

  1. Il n'y a pas de redondance des données, toutes les données sont stockées dans un seul endroit.
  2. Les dépendances de données sont logiques, tous les éléments de données associés sont stockés ensemble.

La normalisation est importante pour de nombreuses raisons, mais principalement parce qu'elle permet aux bases de données de prendre le moins d'espace disque possible, ce qui entraîne une augmentation des performances.

La normalisation est également appelée normalisation des données.

Definir Tech explique la normalisation

Le premier objectif lors de la normalisation des données est de détecter et de supprimer toutes les données en double en regroupant logiquement les redondances de données. Chaque fois qu'une donnée dépend d'une autre, les deux doivent être stockées à proximité dans cet ensemble de données.

En supprimant toutes les anomalies et en organisant les données non structurées sous une forme structurée, la normalisation améliore considérablement la convivialité d'un ensemble de données. Les données peuvent être visualisées plus facilement, les informations peuvent être extraites plus efficacement et les informations peuvent être mises à jour plus rapidement. Au fur et à mesure que les redondances sont fusionnées, le risque d'erreurs et de doublons rendant les données encore plus désorganisées est réduit. En plus de tout cela, une base de données normalisée prend moins d'espace, se débarrasse de nombreux problèmes d'espace disque et augmente considérablement ses performances globales.

Les trois principaux types de normalisation sont énumérés ci-dessous. Remarque: «NF» fait référence à la «forme normale».

Première forme normale (1NF)

Les tableaux de 1NF doivent respecter certaines règles:

  • Chaque cellule ne doit contenir qu'une seule valeur (atomique).

  • Chaque colonne de la table doit porter un nom unique.

  • Toutes les valeurs d'une colonne doivent appartenir au même domaine.

Deuxième forme normale (2NF)

Les tables dans 2NF doivent être dans 1NF et ne pas avoir de dépendance partielle (par exemple, chaque attribut non principal doit dépendre de la clé primaire de la table).

Troisième forme normale (3NF)

Les tables dans 3NF doivent être dans 2NF et ne pas avoir de dépendances fonctionnelles transitives sur la clé primaire.

Les deux NF suivants existent également mais sont rarement utilisés:

Forme normale de Boyce-Codd (BCNF)

Une version supérieure du 3NF, la forme normale de Boyce-Codd est utilisée pour corriger les anomalies qui pourraient résulter si une plus d'une clé candidate existe. Aussi connu sous le nom de forme normale 3.5, le BCNF doit être en 3NF et dans toutes les dépendances fonctionnelles (X → Y), X doit être une super clé.

Quatrième forme normale (4NF)

Pour qu'une table soit en 4NF, elle doit être en BCNF et ne pas avoir de dépendance à valeurs multiples.

Les trois premières NF ont été dérivées au début des années 1970 par le père du modèle de données relationnelles, EF Codd. Presque tous les moteurs de bases de données relationnelles actuels utilisent ses règles.

Certains moteurs de bases de données relationnelles ne répondent pas strictement aux critères de toutes les règles de normalisation. Un exemple est la fonctionnalité de champs à valeurs multiples introduite par Microsoft dans l'application de base de données Access 2007. Il y a eu un débat houleux dans les cercles de bases de données pour savoir si ces fonctionnalités disqualifient maintenant ces applications d'être de véritables systèmes de gestion de bases de données relationnelles.