Fundamentos de Normalización y Bases de Datos Relacionales

Clasificado en Informática

Escrito el en español con un tamaño de 6,59 KB

Normalización de Bases de Datos (BD NOR)

La normalización en bases de datos busca optimizar la estructura de las tablas para reducir la redundancia de datos y mejorar la integridad. Las actualizaciones se consiguen con un mínimo de operaciones porque solamente se necesita acceder a los campos o tablas estrictamente necesarios.

Una relación está en forma normal si satisface un cierto conjunto de restricciones.

Formas Normales

Primera Forma Normal (1FN)

Una relación está en 1FN si y solo si todos los dominios de sus atributos son atómicos (contienen valores indivisibles) y no existen grupos repetitivos.

Ejemplo: Una tabla inicial con Legajo, NombreApellido, Materia. Si NombreApellido contiene tanto nombre como apellido juntos, no es atómico.

Solución: Se dividen los atributos no atómicos. Para el ejemplo, se podría separar NombreApellido en Nombre y Apellido. Si Materia representara una lista de materias, se crearía una nueva tabla relacionando Legajo y CodMateria, donde CodMateria sería parte de la clave junto con Legajo en la nueva tabla.

Segunda Forma Normal (2FN)

Una relación está en 2FN si:

  • Está en 1FN.
  • Todos sus atributos no clave dependen funcionalmente de la clave principal completa.

Se deben eliminar las dependencias parciales (donde un atributo no clave depende solo de una parte de la clave principal compuesta). Esto se logra mediante el desdoblamiento de las relaciones, colocando los atributos que dependen parcialmente en una nueva tabla junto con la parte de la clave de la que dependen.

Tercera Forma Normal (3FN)

Una relación está en 3FN si:

  • Está en 2FN.
  • Ningún atributo no clave depende transitivamente de la clave principal (es decir, ningún atributo no clave depende funcionalmente de otro atributo no clave).

Ejemplo: Si en una tabla Alumno(Legajo, Nombre, CodPostal, Localidad), donde Legajo es la clave primaria, existe una dependencia funcional entre CodPostal y Localidad (CodPostal -> Localidad), hay una dependencia transitiva (Legajo -> CodPostal -> Localidad).

Solución: Se crea una nueva tabla Ciudad(CodPostal, Localidad) y se deja solo CodPostal en la tabla Alumno como clave foránea.

Forma Normal de Boyce-Codd (BCNF)

La BCNF es una versión más estricta de la 3FN. Es útil cuando existen varias claves candidatas y estas se solapan.

Una relación está en BCNF si para cada dependencia funcional no trivial X -> Y, X es una superclave.

Toda relación en BCNF está también en 3FN. Si una relación en 3FN tiene dependencias donde un atributo no clave determina parte de una clave candidata, no está en BCNF y debe desdoblarse.

Cuarta Forma Normal (4FN)

Una relación está en 4FN si:

  • Está en 3FN o BCNF.
  • No posee dependencias multivaluadas no triviales.

Una dependencia multivaluada ocurre cuando existen al menos tres atributos (por ejemplo, A, B, C) tales que para cada valor de A, existe un conjunto bien definido de valores de B y un conjunto bien definido de valores de C, pero estos conjuntos son independientes entre sí. Esto puede causar redundancia.

Quinta Forma Normal (5FN)

También conocida como Forma Normal de Proyección-Unión (PJ/NF), está diseñada para reducir aún más la redundancia en bases de datos relacionales.

Una relación está en 5FN si:

  • Está en 4FN.
  • Cada dependencia de unión (join dependency) en ella es implicada por las claves candidatas.

Esto significa que no se puede descomponer la tabla en tablas más pequeñas sin perder información o crear datos espurios, a menos que la descomposición se base en las claves candidatas.


Conceptos de Bases de Datos Relacionales (BDR)

Una Base de Datos Relacional (BDR) se compone de un conjunto de tablas o relaciones, a las cuales se les asigna un nombre único.

Componentes Básicos

  • Relación: Una tabla con filas y columnas.
  • Atributo: Una columna de una relación, con un nombre específico.
  • Dominio: El conjunto de posibles valores permitidos para un atributo.
  • Tupla: Una fila de una relación, que representa un registro.

Esquema Relacional

El Esquema de la Relación (R) especifica el nombre de la relación, el nombre de cada atributo (campo) y el dominio de cada atributo.

Restricciones de Integridad (RI)

Son condiciones especificadas en el esquema de la base de datos que restringen los datos que pueden almacenarse válidamente. Si una base de datos cumple con todas sus restricciones de integridad, se considera un ejemplar legal. El Sistema Gestor de Base de Datos (SGBD) es el encargado de verificar y hacer cumplir estas restricciones.

Claves

Clave Primaria (CP)

Es un subconjunto mínimo de atributos de una relación que constituyen un identificador unívoco para cada fila (tupla). No puede contener valores nulos y debe ser única para toda la tabla.

Clave Foránea (CF)

Es un atributo o conjunto de atributos en una tabla (la tabla que hace la referencia) cuyos valores deben coincidir con los valores de la clave primaria de otra tabla (la tabla referenciada) o ser nulos (si se permite).

Integridad Referencial

Es una restricción de integridad que garantiza la consistencia y validez entre las entidades relacionadas. Implica que cada valor en una clave foránea debe corresponder a un valor válido existente en la clave primaria de la tabla relacionada, o bien ser nulo (si la restricción lo permite).

Modelo de Datos

Es un conjunto de conceptos y estructuras descriptivas de alto nivel que se utilizan para organizar los datos y ocultar los detalles de almacenamiento de bajo nivel, facilitando la interacción del usuario con la base de datos.

Entradas relacionadas: