Plotagem de Distribuições Cumulativas
Um ecdfplot representa a proporção ou contagem de observações que ficam abaixo de cada valor único em um conjunto de dados.
Em comparação com um histograma ou gráfico de densidade, possui uma vantagem significativa: cada observação é visualizada diretamente. Isso significa que não há intervalos a serem ajustados nem parâmetros de suavização que possam distorcer os dados. Muitas vezes, é considerado a forma mais "honesta" de visualizar uma distribuição.
Parâmetros Principais
Por padrão, o gráfico mostra a proporção (0 a 1) de dados menores que X. É possível alterar esse comportamento:
stat='count': em vez de uma porcentagem, o eixo Y mostra o número de observações;complementary=True: inverte a lógica. Em vez de mostrar valores abaixo do limite, mostra valores acima dele. Isso é essencialmente uma "curva de sobrevivência" (por exemplo, "Quantos pinguins têm um bico maior que 50mm?").
Exemplo
Veja como complementary altera a visualização. A curva desce em vez de subir.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analise os comprimentos dos bicos dos pinguins para verificar quantos deles excedem determinado comprimento.
- Importe
pandas,seabornematplotlib.pyplot. - Leia o conjunto de dados dos pinguins.
- Crie um gráfico ECDF:
- Defina
xcomo'bill_length_mm'. - Agrupe por
'island'utilizandohue. - Ative o modo "survival" configurando
complementary=True. - Exiba números absolutos configurando
stat='count'. - Utilize a paleta
'mako'. - Utilize a variável
dfcomo fonte de dados.
- Exiba o gráfico.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Incrível!
Completion taxa melhorada para 4.55
Plotagem de Distribuições Cumulativas
Deslize para mostrar o menu
Um ecdfplot representa a proporção ou contagem de observações que ficam abaixo de cada valor único em um conjunto de dados.
Em comparação com um histograma ou gráfico de densidade, possui uma vantagem significativa: cada observação é visualizada diretamente. Isso significa que não há intervalos a serem ajustados nem parâmetros de suavização que possam distorcer os dados. Muitas vezes, é considerado a forma mais "honesta" de visualizar uma distribuição.
Parâmetros Principais
Por padrão, o gráfico mostra a proporção (0 a 1) de dados menores que X. É possível alterar esse comportamento:
stat='count': em vez de uma porcentagem, o eixo Y mostra o número de observações;complementary=True: inverte a lógica. Em vez de mostrar valores abaixo do limite, mostra valores acima dele. Isso é essencialmente uma "curva de sobrevivência" (por exemplo, "Quantos pinguins têm um bico maior que 50mm?").
Exemplo
Veja como complementary altera a visualização. A curva desce em vez de subir.
1234567891011121314151617import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('penguins') # Create a Complementary ECDF # This answers: "How many penguins have a flipper length GREATER than X?" sns.ecdfplot( data=df, x='flipper_length_mm', hue='species', stat='count', # Show exact number of penguins complementary=True # Curve descends from Total to 0 ) plt.show()
Swipe to start coding
Analise os comprimentos dos bicos dos pinguins para verificar quantos deles excedem determinado comprimento.
- Importe
pandas,seabornematplotlib.pyplot. - Leia o conjunto de dados dos pinguins.
- Crie um gráfico ECDF:
- Defina
xcomo'bill_length_mm'. - Agrupe por
'island'utilizandohue. - Ative o modo "survival" configurando
complementary=True. - Exiba números absolutos configurando
stat='count'. - Utilize a paleta
'mako'. - Utilize a variável
dfcomo fonte de dados.
- Exiba o gráfico.
Solução
Obrigado pelo seu feedback!
single