top of page

🗑️ Eliminación y recuperación de Managed y External Tables

  • 24 jun
  • 2 min de lectura

Introducción

Después de comprender las diferencias entre Managed Tables y External Tables, surge una pregunta muy importante:

👉 ¿Qué sucede cuando eliminamos una tabla por error?

La respuesta depende del tipo de tabla que estemos utilizando.

📦 Recuperando una Managed Table

Las Managed Tables son administradas completamente por Databricks. Esto significa que Databricks controla tanto:

  • Los metadatos registrados en Unity Catalog.

  • Los archivos físicos almacenados en Delta Lake.

Cuando ejecutamos un DROP TABLE, la información no desaparece inmediatamente de forma permanente. Durante un período de retención es posible recuperar la tabla utilizando:

UNDROP TABLE ...

Esto permite restaurar:

  • ✅ Metadatos

  • ✅ Datos físicos

  • ✅ Definición original

Sin necesidad de recrear la tabla manualmente.

🌎 Recuperando una External Table

Las External Tables funcionan de manera diferente. En este modelo:

  • Unity Catalog administra los metadatos.

  • Los archivos físicos permanecen en almacenamiento externo.

Cuando ejecutamos un DROP TABLE:

  • ❌ Se eliminan los metadatos.

  • ✅ Los datos físicos permanecen almacenados.

Sin embargo, existe una diferencia importante:

👉 UNDROP TABLE no está disponible para recuperar External Tables.

Para volver a utilizarlas es necesario registrar nuevamente la tabla apuntando a la ubicación donde continúan existiendo los datos.

La diferencia clave

La verdadera diferencia no está en los datos. Los datos pueden seguir existiendo en ambos escenarios.

La diferencia está en cómo recuperamos la definición de la tabla:

📦 Managed Table → Recuperación mediante UNDROP TABLE.

🌎 External Table → Re-registro manual de los metadatos.

Conclusión

Entender esta diferencia resulta fundamental para evitar errores operativos y diseñar correctamente la estrategia de gestión de datos dentro de un Lakehouse. 📌 En el notebook muestro paso a paso qué ocurre al eliminar y recuperar ambos tipos de tablas, permitiendo observar cómo interactúan Unity Catalog, Delta Lake y el almacenamiento físico. Repositorio-GitHub

Comentarios


IngenieriaDatos.jpg

Tomar decisiones sin datos es como navegar en la oscuridad...

En la era digital, los datos son el activo más valioso de las empresas; su correcta recopilación, análisis y aplicación estratégica son clave para impulsar la toma de decisiones informada, la innovación y el éxito empresarial

  • GitHub
  • LinkedIn
  • Youtube

Copyrights © 2026 Brayan Neciosup Bolaños All rights reserved.

bottom of page