top of page

🔎 Manipulación de Datos en Pandas y Polars - Fase 2: Exploración Inicial de Datasets 🐼🐻‍❄️

  • Foto del escritor: Brayan Neciosup
    Brayan Neciosup
  • 29 jul
  • 1 Min. de lectura

En esta segunda fase del proceso de manipulación de datos con Pandas y Polars, abordo la exploración inicial de datasets, paso indispensable para comenzar a entender la estructura de nuestros datos. Repositorio - Fundamentos de Pandas y Polars

1. Ocultar encabezados (header): Esta opción se utiliza únicamente al leer archivos CSV o Excel, además, solo la necesitaremos si el archivo no contiene encabezado o queremos tratar los títulos como parte de los datos, podemos ocultarlos al leer el archivo.

2. Mostrar registros iniciales y finales del dataset: Esto nos da un panorama rápido del contenido y nos ayuda a detectar patrones, valores vacíos, errores o formatos inesperados.

3. Obtener dimensiones del dataset: Esto nos ayuda a saber el volumen del dataset y planificar mejor el procesamiento.

🧠 Consideración importante:

En esta fase he decidido dejar de referirme a dataframes y comenzar a hablar de datasets, debido que en manipulación de datos lo relevante es el contenido (ya sea Pandas o Polars).

Comentarios


IngenieriaDatos.jpg

Tomar decisiones sin datos es como navegar en la oscuridad...

En la era digital, los datos son el activo más valioso de las empresas; su correcta recopilación, análisis y aplicación estratégica son clave para impulsar la toma de decisiones informada, la innovación y el éxito empresarial

  • GitHub
  • LinkedIn
  • Youtube

Copyrights © 2025 Brayan Neciosup Bolaños All rights reserved.

bottom of page