Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío 4: Modificando DataFrame | Pandas
Desafío de Entrevista en Ciencia de Datos

book
Desafío 4: Modificando DataFrame

Pandas proporciona una plétora de herramientas que permiten modificar fácilmente tanto los datos como la estructura de los DataFrames. Estas capacidades son esenciales porque:

  • Limpieza de datos: Los conjuntos de datos del mundo real suelen estar desordenados. La capacidad de transformar y limpiar los datos garantiza su preparación para el análisis.

  • Versatilidad:** Con frecuencia, la estructura de un conjunto de datos puede no ajustarse a los requisitos de una tarea determinada. Ser capaz de remodelar los datos puede ser un salvavidas.

  • Eficiencia:** Las modificaciones directas a los DataFrames, en lugar de crear nuevos, pueden ahorrar memoria y mejorar el rendimiento.

Familiarizarse con las técnicas para alterar los datos y la estructura de los DataFrames es un paso clave para llegar a ser competente con Pandas.

Tarea

Swipe to start coding

Aproveche el poder de Pandas para alterar los datos y la estructura de DataFrames:

  1. Añade una nueva columna a un DataFrame con los valores Engineer, Doctor y Artist.
    1. Cambia el nombre de las columnas de un DataFrame. Cambie la columna Nombre por Nombre completo y la columna Edad por Edad (años).
  2. Elimine la columna Ciudad de un DataFrame.
    1. Ordene un DataFrame en función de la columna "Edad" (descendente).

Solución

import pandas as pd

# Sample DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
})

# 1. Add a new column to a DataFrame.
df['Occupation'] = ['Engineer', 'Doctor', 'Artist']
display(df)
print('-' * 40)

# 2. Rename columns in a DataFrame.
renamed_df = df.rename(columns={'Name': 'Full Name', 'Age': 'Age (years)'})
display(renamed_df)
print('-' * 40)

# 3. Drop a column from a DataFrame.
reduced_df = renamed_df.drop('City', axis=1)
display(reduced_df)
print('-' * 40)

# 4. Sort a DataFrame based on a specific column.
sorted_df = reduced_df.sort_values(by='Age (years)', ascending=False)
display(sorted_df)
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
single

single

import pandas as pd

# Sample DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
})

# 1. Add a new column to a DataFrame.
df['Occupation'] = ___
display(df)
print('-' * 40)

# 2. Rename columns in a DataFrame.
renamed_df = ___
display(renamed_df)
print('-' * 40)

# 3. Drop a column from a DataFrame.
reduced_df = ___
display(reduced_df)
print('-' * 40)

# 4. Sort a DataFrame based on a specific column.
sorted_df = ___
display(sorted_df)

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

some-alt