Pandas Cheatsheet: La guía más sencilla

Si los datos son una jungla, pandas es tu machete. Si es un novato o simplemente necesita un repaso, este blog es su mapa de bolsillo para trabajar con pandas en Python. Sin jerga. Sin palabrería. Sólo hablar de verdad.
🧠 ¿Qué es pandas?
Pandas es una librería de Python que te ayuda a trabajar con tablas de datos - como Excel, pero sobrealimentado. Hace que sea fácil de limpiar, analizar y remodelar los datos, todo en código.
⚙️ Introducción
Instala pandas:
pip install pandas
Impórtalo en tu código:
import pandas as pd
La mayoría de la gente utiliza pd como atajo, y también debería hacerlo.
Dos estructuras de datos principales
Series: Una columna (como una lista con etiquetas)
DataFrame: Tabla con filas y columnas (como una hoja de cálculo)
🛠️ Creación de un DataFrame
A partir de un diccionario:
data = {
'Name': ['Roberto', 'Mamani'],
'Age': [25, 30]
}
df = pd.DataFrame(data)
Ahora df es su tabla de datos.
Lectura y escritura de archivos
Leer CSV:
df = pd.read_csv('archivo.csv')
Guardar CSV:
df.to_csv('nuevo_archivo.csv', index=False)
También puede leer Excel, JSON, y más.
👀 Cómo ver los datos
df.head() # Primeras 5 filas
df.tail() # Últimas 5 filas
df.info() # Tipos de datos y memoria
df.describe() # Resumen estadísticos (promedio, mediana, etc.)
Selecionando datos:
Columnas:
df['nombre-columna']
Filas:
df.iloc[0] # Por posición
df.loc[0] # Por etiqueta/índice
Filtrar las filas:
df[df['Edad'] > 25]
➕ Añadir o modificar columnas
df['EdadMasDiez'] = df['Edad'] + 10
¿Quieres hacer algo extravagante o elegante?
df = df.assign(Score=lambda x: x['Edad'] * 2)
❌ Datos que faltan
Eliminar filas con valores perdidos:
df.dropna()
Rellenar los valores que faltan:
df.fillna(0)
🧮 Agrupación y agregación
Agrupar por una columna y ejecutar algunas estadísticas:
df.groupby('Departamento')['Salario'].mean()
También puedes usar:
.agg(['sum', 'mean', 'count'])
🔗 Fusionar y unir
Fusionar dos DataFrames:
pd.merge(df1, df2, on='ID', how='inner')
Unir por índice:
df1.join(df2, how='left')
🔄 Dale forma a tus datos
Pivote:
df.pivot(index='Fecha', columns='Producto', values='Ventas')
Fundir (despivotar):
df.melt(id_vars=['ID'], value_vars=['Literatura', 'Ciencia'])
⏳ Trabajar con fechas
Analizar fechas al leer CSV:
df = pd.read_csv('data.csv', parse_dates=['Fecha'])
Remuestreo (por ejemplo, media mensual):
df.resample('M').mean()
¡Asegúrese de que su columna de fecha se establece como el índice primero!
🎯 Pro Tips
Use copy() cuando rebane si va a editar.
Evita los bucles for, usa operaciones vectorizadas en su lugar.
df.apply() es genial, pero úsalo con prudencia; puede ser lento.
🏁 Palabras finales
No necesitas memorizarlo todo. Guarda esto en tus favoritos. Vuelve cuando estés atascado. Pandas no es difícil, sólo da miedo al principio. Pero una vez que lo domesticas, no hay vuelta atrás.