Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Visualização de Gráficos de Dispersão Categóricos | Seção
Visualização Estatística com Seaborn

bookVisualização de Gráficos de Dispersão Categóricos

Em estatística, uma variável categórica é uma variável que pode assumir um de um número limitado de valores possíveis (por exemplo, "Dia da Semana", "Gênero", "País").

Um stripplot é essencialmente um gráfico de dispersão em que um dos eixos representa uma variável categórica. Ele visualiza a distribuição de muitos valores individuais unidimensionais.

Por que usar um Stripplot?

Diferente de um histograma ou de um gráfico de densidade, que agregam dados, um stripplot exibe cada observação individual como um ponto. Isso é ideal para conjuntos de dados menores, nos quais se deseja ver a dispersão exata e identificar valores atípicos.

Principais Parâmetros para Personalização

Como os pontos podem se sobrepor (um problema chamado "overplotting"), o stripplot oferece várias maneiras de torná-los distintos:

  • alpha: controla a transparência (0 a 1). Definir um valor baixo (por exemplo, 0.25) ajuda a visualizar a densidade — áreas mais escuras indicam mais pontos;
  • size: altera o raio dos pontos;
  • marker: altera o formato dos pontos (por exemplo, 'D' para losangos, 's' para quadrados);
  • jitter: adiciona uma pequena quantidade de ruído aleatório à posição dos pontos para que eles não fiquem exatamente sobrepostos (ativado por padrão).

Exemplo Prático

Veja como criar um stripplot que utiliza transparência para lidar com dados sobrepostos.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tarefa

Swipe to start coding

Visualização da distribuição das contas por dia com estilo personalizado.

  1. Definir o estilo como 'whitegrid'. Passar um dicionário para definir a cor de fundo ('axes.facecolor') como 'aliceblue'.
  2. Criar um stripplot utilizando o conjunto de dados tips (df):
  • Mapear 'day' para o eixo x e 'total_bill' para o eixo y.
  • Colorir os pontos com base no status de 'smoker' usando hue.
  • Definir o size dos pontos como 20.
  • Utilizar a paleta 'crest'.
  • Alterar o formato do marcador para diamante usando marker='D'.
  • Definir a transparência alpha como 0.25.
  1. Exibir o gráfico.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 9
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

bookVisualização de Gráficos de Dispersão Categóricos

Deslize para mostrar o menu

Em estatística, uma variável categórica é uma variável que pode assumir um de um número limitado de valores possíveis (por exemplo, "Dia da Semana", "Gênero", "País").

Um stripplot é essencialmente um gráfico de dispersão em que um dos eixos representa uma variável categórica. Ele visualiza a distribuição de muitos valores individuais unidimensionais.

Por que usar um Stripplot?

Diferente de um histograma ou de um gráfico de densidade, que agregam dados, um stripplot exibe cada observação individual como um ponto. Isso é ideal para conjuntos de dados menores, nos quais se deseja ver a dispersão exata e identificar valores atípicos.

Principais Parâmetros para Personalização

Como os pontos podem se sobrepor (um problema chamado "overplotting"), o stripplot oferece várias maneiras de torná-los distintos:

  • alpha: controla a transparência (0 a 1). Definir um valor baixo (por exemplo, 0.25) ajuda a visualizar a densidade — áreas mais escuras indicam mais pontos;
  • size: altera o raio dos pontos;
  • marker: altera o formato dos pontos (por exemplo, 'D' para losangos, 's' para quadrados);
  • jitter: adiciona uma pequena quantidade de ruído aleatório à posição dos pontos para que eles não fiquem exatamente sobrepostos (ativado por padrão).

Exemplo Prático

Veja como criar um stripplot que utiliza transparência para lidar com dados sobrepostos.

1234567891011121314151617
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # Create a customized stripplot sns.stripplot( data=df, x='day', # Categorical axis y='total_bill', # Numerical axis alpha=0.5, # Make points semi-transparent size=10, # Make points larger jitter=True # Spread points out slightly ) plt.show()
copy
Tarefa

Swipe to start coding

Visualização da distribuição das contas por dia com estilo personalizado.

  1. Definir o estilo como 'whitegrid'. Passar um dicionário para definir a cor de fundo ('axes.facecolor') como 'aliceblue'.
  2. Criar um stripplot utilizando o conjunto de dados tips (df):
  • Mapear 'day' para o eixo x e 'total_bill' para o eixo y.
  • Colorir os pontos com base no status de 'smoker' usando hue.
  • Definir o size dos pontos como 20.
  • Utilizar a paleta 'crest'.
  • Alterar o formato do marcador para diamante usando marker='D'.
  • Definir a transparência alpha como 0.25.
  1. Exibir o gráfico.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 9
single

single

some-alt