Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Parplott | Visualisering med Seaborn
Ultimat Visualisering med Python

bookParplott

Note
Definisjon

Pair plot brukes til å visualisere parvise relasjoner mellom numeriske variabler i et datasett. Det ligner på et joint plot, men er ikke begrenset til kun to variabler. Et pair plot lager faktisk et NxN-rutenett av Axes-objekter (flere underplott), der N er antall numeriske variabler (numeriske kolonner i en DataFrame).

Eksempel på pair plot

Beskrivelse av pair plot

I et pair plot deler hver kolonne den samme x-aksen-variabelen, og hver rad deler den samme y-aksen-variabelen. Diagonalen viser histogrammer av individuelle variabler, mens de andre plottene viser scatter plots.

Opprette et Pair Plot

Å opprette et pair plot med seaborn innebærer å kalle funksjonen pairplot(). Den viktigste og eneste påkrevde parameteren er data, som skal være et DataFrame-objekt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame-en iris_df sendes til funksjonen pairplot(). Parameterne height og aspect definerer høyden og bredden (beregnet som høyde multiplisert med aspect) for hver fasett i tommer.

Hue

En annen parameter som er verdt å nevne er hue, som angir variabelen (kolonnenavn) i data som skal brukes til å tilordne ulike farger eller til og med lage separate plott (på én Axes) for hver av dens verdier.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Forskjellen er tydelig her. Datapunktene i hvert spredningsplott er fargelagt basert på arten de tilhører, ved å bruke verdiene fra species-kolonnen. De diagonale plott er nå KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsproblemer er det ofte hensiktsmessig å lage et pair plot med hue-parameteren satt til målvariabelen, som er den kategoriske variabelen vi ønsker å predikere.


Forskjellen er tydelig. Datapunktene i hvert spredningsplott er fargelagt etter arten, basert på verdiene i species-kolonnen. De diagonale plott er erstattet med KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsoppgaver er det ofte nyttig å lage et pair plot med hue-parameteren satt til målvariabelen — den kategoriske variabelen som skal predikeres.

Endring av plott-typer

Du kan endre typen plott som brukes i stedet for standard spredningsplott, samt plottet som vises på diagonalen. Parameteren kind styrer hovedplottene og er som standard satt til spredningsplott, mens parameteren diag_kind styrer diagonalplottene og velges automatisk avhengig av om parameteren hue er satt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige verdier for parameteren kind.

diag_kind kan settes til en av følgende verdier:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alt fungerer på samme måte som for funksjonen jointplot() i denne sammenhengen.

Note
Studer mer
Oppgave

Swipe to start coding

  1. Bruk riktig funksjon for å lage et pair plot.
  2. Angi dataen for plottet til å være penguins_df via det første argumentet.
  3. Angi 'sex' som kolonnen som skal tilordne ulike farger til plottet ved å spesifisere det andre argumentet.
  4. Angi at ikke-diagonale plott skal ha en regresjonslinje ('reg') ved å spesifisere det tredje argumentet.
  5. Sett height til 2.
  6. Sett aspect til 0.8.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 6
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

What other parameters can I use with the pairplot() function?

Can you explain the difference between 'kind' and 'diag_kind' in more detail?

How do I interpret the KDE plots on the diagonal?

close

Awesome!

Completion rate improved to 3.85

bookParplott

Sveip for å vise menyen

Note
Definisjon

Pair plot brukes til å visualisere parvise relasjoner mellom numeriske variabler i et datasett. Det ligner på et joint plot, men er ikke begrenset til kun to variabler. Et pair plot lager faktisk et NxN-rutenett av Axes-objekter (flere underplott), der N er antall numeriske variabler (numeriske kolonner i en DataFrame).

Eksempel på pair plot

Beskrivelse av pair plot

I et pair plot deler hver kolonne den samme x-aksen-variabelen, og hver rad deler den samme y-aksen-variabelen. Diagonalen viser histogrammer av individuelle variabler, mens de andre plottene viser scatter plots.

Opprette et Pair Plot

Å opprette et pair plot med seaborn innebærer å kalle funksjonen pairplot(). Den viktigste og eneste påkrevde parameteren er data, som skal være et DataFrame-objekt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame-en iris_df sendes til funksjonen pairplot(). Parameterne height og aspect definerer høyden og bredden (beregnet som høyde multiplisert med aspect) for hver fasett i tommer.

Hue

En annen parameter som er verdt å nevne er hue, som angir variabelen (kolonnenavn) i data som skal brukes til å tilordne ulike farger eller til og med lage separate plott (på én Axes) for hver av dens verdier.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Forskjellen er tydelig her. Datapunktene i hvert spredningsplott er fargelagt basert på arten de tilhører, ved å bruke verdiene fra species-kolonnen. De diagonale plott er nå KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsproblemer er det ofte hensiktsmessig å lage et pair plot med hue-parameteren satt til målvariabelen, som er den kategoriske variabelen vi ønsker å predikere.


Forskjellen er tydelig. Datapunktene i hvert spredningsplott er fargelagt etter arten, basert på verdiene i species-kolonnen. De diagonale plott er erstattet med KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsoppgaver er det ofte nyttig å lage et pair plot med hue-parameteren satt til målvariabelen — den kategoriske variabelen som skal predikeres.

Endring av plott-typer

Du kan endre typen plott som brukes i stedet for standard spredningsplott, samt plottet som vises på diagonalen. Parameteren kind styrer hovedplottene og er som standard satt til spredningsplott, mens parameteren diag_kind styrer diagonalplottene og velges automatisk avhengig av om parameteren hue er satt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige verdier for parameteren kind.

diag_kind kan settes til en av følgende verdier:

  • 'auto';
  • 'hist';
  • 'kde';
  • None.

Alt fungerer på samme måte som for funksjonen jointplot() i denne sammenhengen.

Note
Studer mer
Oppgave

Swipe to start coding

  1. Bruk riktig funksjon for å lage et pair plot.
  2. Angi dataen for plottet til å være penguins_df via det første argumentet.
  3. Angi 'sex' som kolonnen som skal tilordne ulike farger til plottet ved å spesifisere det andre argumentet.
  4. Angi at ikke-diagonale plott skal ha en regresjonslinje ('reg') ved å spesifisere det tredje argumentet.
  5. Sett height til 2.
  6. Sett aspect til 0.8.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 6
single

single

some-alt