Der so entstandene Entwurf muss nun lediglich noch optimiert werden. Optimierung bedeutet hier verschiedenes, z.B. auch die Beseitigung eventueller Mehrfacheinträge, v.a. aber die Beseitigung von Redundanz in den Daten einer Relation.

6.1 Redundanz

Redundanz bedeutet an dieser Stelle, dass ein und dieselbe Information in einer Relation mehrfach erfasst wird. Z.B. die Tatsache, dass Person X die Programmiersprache C++ beherrscht.

In den folgenden Abschnitten sind viele Beispiele für Redundanzen in Relationen angeführt.

Letztendlich ist eine Regel für die im folgenden dargestellten Bemühungen verantwortlich, die wegen ihrer Bedeutung getrost zur obersten Regel des Datenbankentwurfs ernannt werden kann:

Oberste Regel für Datenbanken

Jede Information darf in einer Datenbank nur einmal vorkommen.

Dabei geht es um Information im „Attributsinne“. Also z.B. die Information, dass Lisa Widmer in der Abteilung Controlling arbeitet, dass Heiner Müller Abteilungsleiter der Abteilung Personalwesen ist, dass Angelika Widmer die Programmiersprache C++ beherrscht, usw.

6.2 Normalformen

Als Werkzeug für diese Optimierung stellt die relationale Datenbanktheorie die Normalformen zur Verfügung. Insgesamt gibt es sechs, die

  • Erste Normalform (1NF),
  • Zweite Normalform (2NF)
  • Dritte Normalform (3NF)
  • Boyce-Codd - Normalform (BCNF)
  • Vierte Normalform (4NF) und die
  • Fünfte Normalform (5NF).

Die einzelnen Normalformen bauen aufeinander auf. Ist die n-te erfüllt, sind auch alle „darunterliegenden“ erfüllt. Jede Normalform hat das Ziel, das Datenmodell - aufbauend auf der vorangehenden - weiter zu „optimieren“. Was dies jeweils bedeutet, wird bei den Normalisierungsschritten betrachtet.

Aufbauend

Die Normalformen kommen zum Zug, wenn die Objekt- und Beziehungsklassen des ersten Entwurfs in Relationen „gegossen“ wurden. Oftmals endet dieser erste Entwurf auch in einer einzigen großen Universalrelation, in die alle gewünschten Attribute geschrieben wurden. Auf die Relationen dieses ersten Datenmodells werden dann die Normalformen angewandt.

Universal­relation