📘📊 Manipulación de Datos en Pandas y Polars - Fase 1: Fuentes de Datos
- Brayan Neciosup
- 24 jul
- 1 Min. de lectura
En esta primera fase de la manipulación de datos me enfoqué en conectar correctamente nuestros scripts con la fuente de los datos, usando tanto Pandas como Polars, dos librerías esenciales en análisis de datos con Python.
🔹 1. Definición de carpeta de origen: Antes de leer cualquier archivo, es fundamental organizar bien las carpetas.
🔹 2. Definir el nombre de un archivo: Establecer el nombre de un archivo y trabajar sobre ello.
🔹 3. Lectura de archivos en Pandas vs Polars: Comparé cómo se leen distintos tipos de archivos en ambas librerías (.csv; .xlsx y .json).
🔍 Conclusiones personales:
Pandas tiene una compatibilidad inmediata con Excel y JSON.
Polars es increíblemente rápido en la lectura de CSV y JSON, aunque para Excel se requiere un paso adicional (fastexcel).
Ambos ofrecen formas limpias de manipular datos, pero Polars gana en velocidad para grandes datasets.
Link Repositorio GitHub: Fundamentos de Pandas y Polars
Comentarios