Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Desafio 4: Alterando DataFrame | Pandas
Desafio de Entrevista em Ciência de Dados

book
Desafio 4: Alterando DataFrame

O Pandas oferece uma ampla gama de ferramentas que permitem a fácil modificação tanto dos dados quanto da estrutura dos DataFrames. Essas capacidades são essenciais porque:

  • Limpeza de Dados: Conjuntos de dados do mundo real frequentemente são desorganizados. A capacidade de transformar e limpar os dados garante que eles estejam preparados para análise.

  • Versatilidade: Frequentemente, a estrutura de um conjunto de dados pode não estar alinhada com os requisitos de uma tarefa específica. Ser capaz de remodelar os dados pode ser um salvador.

  • Eficiência: Modificações diretas em DataFrames, em oposição à criação de novos, podem economizar memória e melhorar o desempenho.

Tornar-se familiar com as técnicas para alterar dados e a estrutura dos DataFrames é um passo chave para se tornar proficiente com o Pandas.

Tarefa

Swipe to start coding

Explore o poder do Pandas para alterar dados e a estrutura de DataFrames:

  1. Adicione uma nova coluna a um DataFrame com os valores Engenheiro, Médico e Artista.
  2. Renomeie colunas em um DataFrame. Altere a coluna Nome para Nome Completo e a coluna Idade para Idade (anos).
  3. Remova uma coluna Cidade de um DataFrame.
  4. Ordene um DataFrame com base na coluna Idade (em ordem decrescente).

Solução

import pandas as pd

# Sample DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
})

# 1. Add a new column to a DataFrame.
df['Occupation'] = ['Engineer', 'Doctor', 'Artist']
display(df)
print('-' * 40)

# 2. Rename columns in a DataFrame.
renamed_df = df.rename(columns={'Name': 'Full Name', 'Age': 'Age (years)'})
display(renamed_df)
print('-' * 40)

# 3. Drop a column from a DataFrame.
reduced_df = renamed_df.drop('City', axis=1)
display(reduced_df)
print('-' * 40)

# 4. Sort a DataFrame based on a specific column.
sorted_df = reduced_df.sort_values(by='Age (years)', ascending=False)
display(sorted_df)
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 4
import pandas as pd

# Sample DataFrame
df = pd.DataFrame({
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
})

# 1. Add a new column to a DataFrame.
df['Occupation'] = ___
display(df)
print('-' * 40)

# 2. Rename columns in a DataFrame.
renamed_df = ___
display(renamed_df)
print('-' * 40)

# 3. Drop a column from a DataFrame.
reduced_df = ___
display(reduced_df)
print('-' * 40)

# 4. Sort a DataFrame based on a specific column.
sorted_df = ___
display(sorted_df)

Pergunte à IA

expand
ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

some-alt