Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Descrevendo os Dados | Analisando os Dados
Primeiros Passos com Pandas

bookDescrevendo os Dados

O pandas oferece o prático método mean(), que calcula a média de todos os valores para cada coluna.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Também é possível usar o mesmo método para determinar o valor médio de uma coluna específica:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

O pandas também fornece o método mode(), que identifica o valor que mais se repete em cada coluna.

df = pd.read_csv(file.csv)
mode_values = df.mode()

Para encontrar a moda de uma coluna específica, utiliza-se o mesmo método:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Nota

Utilizamos [0] após .mode() para extrair o primeiro valor caso existam múltiplas modas. Sem isso, o método retorna uma Série completa.

Outro método útil no pandas é o describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Este método fornece uma visão geral de várias métricas do conjunto de dados, incluindo:

  • Número total de entradas;
  • Valor médio ou média;
  • Desvio padrão;
  • Os valores mínimo e máximo;
  • Os percentis 25º, 50º (mediana) e 75º.
Tarefa

Swipe to start coding

Você recebe um DataFrame chamado wine_data.

  • Calcule a média da coluna 'residual sugar' e armazene o resultado na variável residual_sugar_mean.
  • Calcule a moda da coluna 'fixed acidity' e armazene o resultado na variável fixed_acidity_mode.
  • Recupere uma visão geral de várias estatísticas de wine_data e armazene o resultado na variável described_data.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 11
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 3.03

bookDescrevendo os Dados

Deslize para mostrar o menu

O pandas oferece o prático método mean(), que calcula a média de todos os valores para cada coluna.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Também é possível usar o mesmo método para determinar o valor médio de uma coluna específica:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

O pandas também fornece o método mode(), que identifica o valor que mais se repete em cada coluna.

df = pd.read_csv(file.csv)
mode_values = df.mode()

Para encontrar a moda de uma coluna específica, utiliza-se o mesmo método:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Nota

Utilizamos [0] após .mode() para extrair o primeiro valor caso existam múltiplas modas. Sem isso, o método retorna uma Série completa.

Outro método útil no pandas é o describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Este método fornece uma visão geral de várias métricas do conjunto de dados, incluindo:

  • Número total de entradas;
  • Valor médio ou média;
  • Desvio padrão;
  • Os valores mínimo e máximo;
  • Os percentis 25º, 50º (mediana) e 75º.
Tarefa

Swipe to start coding

Você recebe um DataFrame chamado wine_data.

  • Calcule a média da coluna 'residual sugar' e armazene o resultado na variável residual_sugar_mean.
  • Calcule a moda da coluna 'fixed acidity' e armazene o resultado na variável fixed_acidity_mode.
  • Recupere uma visão geral de várias estatísticas de wine_data e armazene o resultado na variável described_data.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

close

Awesome!

Completion rate improved to 3.03
Seção 3. Capítulo 11
single

single

some-alt