top of page
Brayan Neciosup Bolaños
🌐 Data Engineering Hub


De DBFS a Unity Catalog: El antes y después de Databricks en la gestión de archivos 🗂️
Cuando comencé mi camino con Apache Spark dentro de Databricks (Community Edition) , uno de los pilares más importantes fue entender el...
30 jul2 Min. de lectura


⚡ Real-Time Fundamentals con Apache Kafka
El mundo moderno exige flujos de datos en tiempo real, y Apache Kafka se posiciona como la solución más sólida para lograrlo. A...
24 jul2 Min. de lectura


DataLakeHouse: Comparativa entre Iceberg, Delta Lake y Hudi 📊
Data Lakehouse es una arquitectura moderna en Big Data que combina lo mejor de los Data Lakes y los Data Warehouses , permitiendo...
23 jul2 Min. de lectura


🔍 Diferencias clave entre Data Lake y Data Lakehouse
Cuando hablamos de almacenamiento de datos moderno, surgen dos conceptos esenciales que vale la pena entender: Data Lake y Data...
23 jul1 Min. de lectura


📊 Fundamentos de DataFrames en Pandas y Polars
En esta nueva entrada del recorrido por los fundamentos de manipulación de datos, abordamos uno de los conceptos centrales: los...
21 jul1 Min. de lectura


💡 Casos de Uso de Databricks para Ingeniería de Datos
En este apartado, comparto cuáles son los casos de uso reales y potentes de Databricks dentro del flujo de trabajo moderno de ingeniería...
17 jul2 Min. de lectura


Introducción a Databricks y su evolución hacia el aprendizaje libre (Free Edition 2025)
Databricks es una plataforma en la nube desarrollada por los creadores de Apache Spark que permite a científicos e ingenieros de datos...
16 jul2 Min. de lectura


🚀 Introducción a Apache Spark: Procesamiento distribuido moderno
Aprendiendo desde Databricks 🔍 ¿Qué es Apache Spark? Apache Spark es un motor de procesamiento distribuido en memoria diseñado para...
12 jul2 Min. de lectura


📂 Almacenamiento Distribuido en Apache Hadoop
Explorando el núcleo del procesamiento Big Data open source 🔍 ¿Por qué tecnologías open source? El ecosistema actual de Big Data se...
11 jul2 Min. de lectura


🏗️ Arquitectura moderna de Big Data: ¡Más que solo manejar datos!
Cuando hablamos de Big Data , no solo se trata de volumen, velocidad o variedad. Se trata de arquitectura : cómo capturamos, almacenamos,...
11 jul1 Min. de lectura


⚙️ Las 5 Vs del Big Data y su papel como marco de trabajo
Cuando escuchamos “Big Data”, muchas veces pensamos solo en grandes volúmenes de información . Pero Big Data es mucho más que eso : es...
10 jul2 Min. de lectura


📊 ¿Qué es realmente el Big Data? Más allá del “dato masivo”...
Cuando hablamos de Big Data , no solo nos referimos a grandes volúmenes de datos, sino, estamos hablando de un ecosistema completo :...
10 jul2 Min. de lectura


💧 ¿Qué es un Data Lake?
Un Data Lake es un repositorio centralizado que almacena cualquier tipo de dato en su formato nativo (crudo), sin necesidad de...
9 jul1 Min. de lectura


🚰 Pipelines vs. ETL: ¿son lo mismo en Data Engineering?
🔁 ¿Qué es un pipeline de datos? Es un proceso tanto manual y/o automatizado que realiza un ingeniero de datos como una de sus funciones...
9 jul1 Min. de lectura


🔁 Datos de Streaming: el pulso del mundo en tiempo real
Son datos que se generan y procesan en tiempo real , provenientes de eventos que surgen en el instante, como: Dispositivos IoT...
9 jul1 Min. de lectura


Datos Operativos vs Analíticos en Data Engineering
¿Sabías que no todos los datos sirven para lo mismo en una empresa? Hay dos categorías fundamentales: operativos y analíticos , y cada...
5 jul1 Min. de lectura


🚀 ¿Qué es la Ingeniería de Datos?
La Ingeniería de Datos es el proceso de recopilar, transformar y consolidar datos desde múltiples fuentes, para crear una base única y...
3 jul1 Min. de lectura
bottom of page