Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío 5: Iterando Sobre Datos | Pandas
Desafío de Entrevista en Ciencia de Datos

book
Desafío 5: Iterando Sobre Datos

Iterar sobre conjuntos de datos en Pandas es una operación crítica, especialmente cuando es necesario aplicar pasos personalizados de procesamiento de datos a cada fila o columna. Pandas ofrece:

  • Flexibilidad: Tanto si necesita procesar datos por filas, columnas o celdas, Pandas le ofrece múltiples métodos.

  • Eficiencia:** Aunque normalmente es más eficiente usar operaciones vectorizadas de Pandas, a veces la iteración es el enfoque más directo.

Entender cómo iterar eficazmente sobre conjuntos de datos en Pandas puede ayudar enormemente en la fase de limpieza y preprocesamiento de datos.

Tarea

Swipe to start coding

Descubra diferentes formas de iterar sobre conjuntos de datos en Pandas:

  1. Iterar sobre filas de un DataFrame.
    1. Iterar sobre nombres de columnas de un DataFrame.
  2. Aplicar una función personalizada a cada celda de una columna de un DataFrame.
  3. Utilice la función map para formatear todo el DataFrame.

Solución

import pandas as pd

# Sample DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
})

# 1. Iterate over rows of a DataFrame.
print('--- Task 1 ---')
for index, row in df.iterrows():
print(row)
print('-' * 20)

# 2. Iterate over columns of a DataFrame.
print('\n--- Task 2 ---')
for column in df:
print(column)

# 3. Apply a custom function to each cell in a DataFrame column.
print('\n--- Task 3 ---')
def add_suffix(cell):
return str(cell) + "_suffix"

df['Name'] = df['Name'].apply(add_suffix)
print(df)

# 4. Replace values in the City column according replacement_dict.
print('\n--- Task 4 ---')
replacement_dict = {
'New York': 'NY',
'San Francisco': 'SF',
'Los Angeles': 'LA'
}

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 5
import pandas as pd

# Sample DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
})

# 1. Iterate over rows of a DataFrame.
print('--- Task 1 ---')
for index, row in ___:
print(row)
print('-' * 20)

# 2. Iterate over columns of a DataFrame.
print('\n--- Task 2 ---')
for column in ___:
print(column)

# 3. Apply a custom function to each cell in a DataFrame column.
print('\n--- Task 3 ---')
def add_suffix(cell):
return str(cell) + "_suffix"

df['Name'] = ___
print(df)

# 4. Replace values in the City column according replacement_dict.
print('\n--- Task 4 ---')
replacement_dict = {
'New York': 'NY',
'San Francisco': 'SF',
'Los Angeles': 'LA'
}

Pregunte a AI

expand
ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

some-alt