🛡️ Constraints en Delta Tables
- hace 4 días
- 1 min de lectura
Cuando comenzamos a trabajar con Delta Lake es normal asumir que los constraints funcionan igual que en una base de datos relacional. Sin embargo, Databricks adopta un enfoque diferente y podemos agruparlos en dos categorías principales:
✅ Enforced Constraints: Son restricciones que Delta Lake sí valida durante la escritura de datos., es decir, si un registro incumple alguna de estas condiciones, la operación es rechazada. Entre ellas encontramos:
CHECK
NOT NULL
ℹ️ Informational Constraints
También existen restricciones como:
PRIMARY KEY
FOREIGN KEY
UNIQUE
Sin embargo, actualmente tienen un propósito informativo. Es decir, documentan el modelo de datos, pero no validan ni bloquean registros que incumplan estas reglas.
¿Por qué sucede esto?
Databricks está orientado al procesamiento analítico de grandes volúmenes de datos, donde el rendimiento y la escalabilidad tienen un papel fundamental.
Por ello, gran parte de las validaciones de calidad suelen implementarse durante los procesos de ingestión y transformación de datos, en lugar de depender exclusivamente de las restricciones de la tabla.
📌 En el notebook asociado a esta práctica muestro cómo crear cada tipo de constraint y analizo su comportamiento dentro de Delta Lake. Notebook-Constraints


Comentarios