🗑️ Eliminación y recuperación de Managed y External Tables
- 24 jun
- 2 min de lectura
Introducción
Después de comprender las diferencias entre Managed Tables y External Tables, surge una pregunta muy importante:
👉 ¿Qué sucede cuando eliminamos una tabla por error?
La respuesta depende del tipo de tabla que estemos utilizando.
📦 Recuperando una Managed Table
Las Managed Tables son administradas completamente por Databricks. Esto significa que Databricks controla tanto:
Los metadatos registrados en Unity Catalog.
Los archivos físicos almacenados en Delta Lake.
Cuando ejecutamos un DROP TABLE, la información no desaparece inmediatamente de forma permanente. Durante un período de retención es posible recuperar la tabla utilizando:
UNDROP TABLE ...
Esto permite restaurar:
✅ Metadatos
✅ Datos físicos
✅ Definición original
Sin necesidad de recrear la tabla manualmente.
🌎 Recuperando una External Table
Las External Tables funcionan de manera diferente. En este modelo:
Unity Catalog administra los metadatos.
Los archivos físicos permanecen en almacenamiento externo.
Cuando ejecutamos un DROP TABLE:
❌ Se eliminan los metadatos.
✅ Los datos físicos permanecen almacenados.
Sin embargo, existe una diferencia importante:
👉 UNDROP TABLE no está disponible para recuperar External Tables.
Para volver a utilizarlas es necesario registrar nuevamente la tabla apuntando a la ubicación donde continúan existiendo los datos.
La diferencia clave
La verdadera diferencia no está en los datos. Los datos pueden seguir existiendo en ambos escenarios.
La diferencia está en cómo recuperamos la definición de la tabla:
📦 Managed Table → Recuperación mediante UNDROP TABLE.
🌎 External Table → Re-registro manual de los metadatos.
Conclusión
Entender esta diferencia resulta fundamental para evitar errores operativos y diseñar correctamente la estrategia de gestión de datos dentro de un Lakehouse. 📌 En el notebook muestro paso a paso qué ocurre al eliminar y recuperar ambos tipos de tablas, permitiendo observar cómo interactúan Unity Catalog, Delta Lake y el almacenamiento físico. Repositorio-GitHub


Comentarios