Pandas Cheatsheet: La guía más sencilla

Escrito por:Wilson Quispe

jun 17, 2025

Si los datos son una jungla, pandas es tu machete. Si es un novato o simplemente necesita un repaso, este blog es su mapa de bolsillo para trabajar con pandas en Python. Sin jerga. Sin palabrería. Sólo hablar de verdad.

¿Qué es pandas?

Pandas es una librería de Python que te ayuda a trabajar con tablas de datos - como Excel, pero sobrealimentado. Hace que sea fácil de limpiar, analizar y remodelar los datos, todo en código.

Introducción

Instala pandas:

pip install pandas

Impórtalo en tu código:

import pandas as pd

La mayoría de la gente utiliza pd como atajo, y también debería hacerlo.

Dos estructuras de datos principales

Series: Una columna (como una lista con etiquetas)

DataFrame: Tabla con filas y columnas (como una hoja de cálculo)

Creación de un DataFrame

A partir de un diccionario:

data = {
    'Name': ['Roberto', 'Mamani'],
    'Age': [25, 30]
}
df = pd.DataFrame(data)

Ahora df es su tabla de datos.

Lectura y escritura de archivos

Leer CSV:

df = pd.read_csv('archivo.csv')

Guardar CSV:

df.to_csv('nuevo_archivo.csv', index=False)

También puede leer Excel, JSON, y más.

Cómo ver los datos

df.head()      # Primeras 5 filas
df.tail()      # Últimas 5 filas
df.info()      # Tipos de datos y memoria
df.describe()  # Resumen estadísticos (promedio, mediana, etc.)

Selecionando datos:

Columnas:

df['nombre-columna']

Filas:

df.iloc[0]       # Por posición
df.loc[0]        # Por etiqueta/índice

Filtrar las filas:

df[df['Edad'] > 25]

➕ Añadir o modificar columnas

df['EdadMasDiez'] = df['Edad'] + 10

¿Quieres hacer algo extravagante o elegante?

df = df.assign(Score=lambda x: x['Edad'] * 2)

Datos que faltan

Eliminar filas con valores perdidos:

df.dropna()

Rellenar los valores que faltan:

df.fillna(0)

Agrupación y agregación

Agrupar por una columna y ejecutar algunas estadísticas:

df.groupby('Departamento')['Salario'].mean()

También puedes usar:

.agg(['sum', 'mean', 'count'])

Fusionar y unir

Fusionar dos DataFrames:

pd.merge(df1, df2, on='ID', how='inner')

Unir por índice:

df1.join(df2, how='left')

Dale forma a tus datos

Pivote:

df.pivot(index='Fecha', columns='Producto', values='Ventas')

Fundir (despivotar):

df.melt(id_vars=['ID'], value_vars=['Literatura', 'Ciencia'])

Trabajar con fechas

Analizar fechas al leer CSV:

df = pd.read_csv('data.csv', parse_dates=['Fecha'])

Remuestreo (por ejemplo, media mensual):

df.resample('M').mean()

¡Asegúrese de que su columna de fecha se establece como el índice primero!

Pro Tips

Use copy() cuando rebane si va a editar.

Evita los bucles for, usa operaciones vectorizadas en su lugar.

df.apply() es genial, pero úsalo con prudencia; puede ser lento.

Palabras finales

No necesitas memorizarlo todo. Guarda esto en tus favoritos. Vuelve cuando estés atascado. Pandas no es difícil, sólo da miedo al principio. Pero una vez que lo domesticas, no hay vuelta atrás.