📊Unity Catalog en acción: implementación técnica y escritura de archivos (CSV, Parquet, Delta)
- Brayan Neciosup
- hace 13 horas
- 1 Min. de lectura
Con la llegada de Databricks Free Edition (2025), trabajar con archivos ya no se limita a simples rutas de almacenamiento. Todo sigue un modelo jerárquico estructurado que promueve gobernanza, rendimiento y escalabilidad. En esta entrada, aprenderás cómo crear catálogos, esquemas y volúmenes mediante código, y cómo escribir tus archivos en distintos formatos, incluyendo diferencias fundamentales entre almacenar en volúmenes o registrar tablas gobernadas.
1️⃣ Formas de interactuar con Unity Catalog
Podemos gestionar Unity Catalog desde dos caminos:
a) Desde la UI (Interfaz de usuario):
Crear catálogos, esquemas y volúmenes visualmente
Subir archivos desde tu PC que automáticamente se convierten en Delta Tables
Navegación clara y conexión directa con BI tools
Todo lo subido es gobernado y registrado
b) Desde un notebook (vía SQL o PySpark):
Aquí es donde empieza la magia técnica. Podemos usar Spark SQL o PySpark para controlar cada aspecto (Revisar Repositorio GitHub).

Esta publicación marca el lado técnico del uso de Unity Catalog, desde la creación de estructuras jerárquicas hasta la escritura de archivos en distintos formatos. Conocer la diferencia entre almacenar archivos físicamente y registrarlos como entidades gobernadas te dará control total sobre tus datos.
En la siguiente entrega, abordaremos Spark SQL, ahora sí, con el entorno de datos totalmente gobernado y listo.
Komentáře