top of page

📘📊 Manipulación de Datos en Pandas y Polars - Fase 1: Fuentes de Datos

  • Foto del escritor: Brayan Neciosup
    Brayan Neciosup
  • 24 jul
  • 1 Min. de lectura

En esta primera fase de la manipulación de datos me enfoqué en conectar correctamente nuestros scripts con la fuente de los datos, usando tanto Pandas como Polars, dos librerías esenciales en análisis de datos con Python.

🔹 1. Definición de carpeta de origen: Antes de leer cualquier archivo, es fundamental organizar bien las carpetas.

🔹 2. Definir el nombre de un archivo: Establecer el nombre de un archivo y trabajar sobre ello.

🔹 3. Lectura de archivos en Pandas vs Polars: Comparé cómo se leen distintos tipos de archivos en ambas librerías (.csv; .xlsx y .json).

🔍 Conclusiones personales:

  • Pandas tiene una compatibilidad inmediata con Excel y JSON.

  • Polars es increíblemente rápido en la lectura de CSV y JSON, aunque para Excel se requiere un paso adicional (fastexcel).

  • Ambos ofrecen formas limpias de manipular datos, pero Polars gana en velocidad para grandes datasets.

Link Repositorio GitHub: Fundamentos de Pandas y Polars

Comentarios


data_analisis.png

Tomar decisiones sin datos es como navegar en la oscuridad...

En la era digital, los datos son el activo más valioso de las empresas; su correcta recopilación, análisis y aplicación estratégica son clave para impulsar la toma de decisiones informada, la innovación y el éxito empresarial

No dudes en ponerte en contacto para colaborar o simplemente intercambiar ideas! Juntos, podemos seguir descifrando el lenguaje de los datos y construir un futuro más informado.

© 2035 Creado por Mentes Creativas con Wix.com

bottom of page