Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Plotagem de Distribuições Cumulativas | Seção
Visualização Estatística com Seaborn

bookPlotagem de Distribuições Cumulativas

Um ecdfplot representa a proporção ou contagem de observações que ficam abaixo de cada valor único em um conjunto de dados.

Em comparação com um histograma ou gráfico de densidade, possui uma vantagem significativa: cada observação é visualizada diretamente. Isso significa que não há intervalos a serem ajustados nem parâmetros de suavização que possam distorcer os dados. Muitas vezes, é considerado a forma mais "honesta" de visualizar uma distribuição.

Parâmetros Principais

Por padrão, o gráfico mostra a proporção (0 a 1) de dados menores que X. É possível alterar esse comportamento:

  • stat='count': em vez de uma porcentagem, o eixo Y mostra o número de observações;
  • complementary=True: inverte a lógica. Em vez de mostrar valores abaixo do limite, mostra valores acima dele. Isso é essencialmente uma "curva de sobrevivência" (por exemplo, "Quantos pinguins têm um bico maior que 50mm?").

Exemplo

Veja como complementary altera a visualização. A curva desce em vez de subir.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tarefa

Swipe to start coding

Analise os comprimentos dos bicos dos pinguins para verificar quantos deles excedem determinado comprimento.

  1. Importe pandas, seaborn e matplotlib.pyplot.
  2. Leia o conjunto de dados dos pinguins.
  3. Crie um gráfico ECDF:
  • Defina x como 'bill_length_mm'.
  • Agrupe por 'island' utilizando hue.
  • Ative o modo "survival" configurando complementary=True.
  • Exiba números absolutos configurando stat='count'.
  • Utilize a paleta 'mako'.
  • Utilize a variável df como fonte de dados.
  1. Exiba o gráfico.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 7
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

bookPlotagem de Distribuições Cumulativas

Deslize para mostrar o menu

Um ecdfplot representa a proporção ou contagem de observações que ficam abaixo de cada valor único em um conjunto de dados.

Em comparação com um histograma ou gráfico de densidade, possui uma vantagem significativa: cada observação é visualizada diretamente. Isso significa que não há intervalos a serem ajustados nem parâmetros de suavização que possam distorcer os dados. Muitas vezes, é considerado a forma mais "honesta" de visualizar uma distribuição.

Parâmetros Principais

Por padrão, o gráfico mostra a proporção (0 a 1) de dados menores que X. É possível alterar esse comportamento:

  • stat='count': em vez de uma porcentagem, o eixo Y mostra o número de observações;
  • complementary=True: inverte a lógica. Em vez de mostrar valores abaixo do limite, mostra valores acima dele. Isso é essencialmente uma "curva de sobrevivência" (por exemplo, "Quantos pinguins têm um bico maior que 50mm?").

Exemplo

Veja como complementary altera a visualização. A curva desce em vez de subir.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
copy
Tarefa

Swipe to start coding

Analise os comprimentos dos bicos dos pinguins para verificar quantos deles excedem determinado comprimento.

  1. Importe pandas, seaborn e matplotlib.pyplot.
  2. Leia o conjunto de dados dos pinguins.
  3. Crie um gráfico ECDF:
  • Defina x como 'bill_length_mm'.
  • Agrupe por 'island' utilizando hue.
  • Ative o modo "survival" configurando complementary=True.
  • Exiba números absolutos configurando stat='count'.
  • Utilize a paleta 'mako'.
  • Utilize a variável df como fonte de dados.
  1. Exiba o gráfico.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 7
single

single

some-alt