Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Parplott | Visualisering med Seaborn
Ultimate Visualisering med Python

Sveip for å vise menyen

book
Parplott

Note
Definisjon

Pair plot brukes til å visualisere parvise relasjoner mellom numeriske variabler i et datasett. Det ligner på et joint plot, men er ikke begrenset til kun to variabler. En pair plot lager faktisk et NxN-rutenett av Axes-objekter (flere delplott), hvor N er antall numeriske variabler (numeriske kolonner i en DataFrame).

Beskrivelse av Pair Plot

I en pair plot deler hver kolonne den samme x-aksen variabelen, og hver rad deler den samme y-aksen variabelen. Diagonalen viser histogrammer av individuelle variabler, mens de andre plottene viser spredningsdiagrammer.

Opprettelse av Pair Plot

Å opprette en pair plot med seaborn innebærer å kalle funksjonen pairplot(). Den viktigste og eneste påkrevde parameteren er data, som skal være et DataFrame-objekt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame-en iris_df sendes til funksjonen pairplot(). Parameterne height og aspect definerer høyden og bredden (beregnet som høyde multiplisert med aspekt) til hver fasett i tommer.

Hue

En annen parameter som er verdt å nevne er hue, som angir variabelen (kolonnenavn) i data for å tilordne plottaspekter til forskjellige farger eller til og med opprette separate plott (på én Axes) for hver av dens verdier.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Forskjellen er tydelig her. Datapunktene i hvert spredningsdiagram er farget basert på arten de tilhører, ved å bruke verdiene fra species-kolonnen. De diagonale plottene er nå KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsproblemer er det ofte hensiktsmessig å lage et pair plot med hue-parameteren satt til målvariabelen, som er den kategoriske variabelen vi ønsker å predikere.


Forskjellen er klar. Datapunktene i hvert spredningsdiagram er farget etter arten, basert på verdiene i species-kolonnen. De diagonale plottene er erstattet med KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsoppgaver er det ofte nyttig å lage et pair plot med hue-parameteren satt til målvariabelen — den kategoriske variabelen som skal predikeres.

Endre plottyper

Du kan endre typen plott som brukes i stedet for standard spredningsdiagrammer, samt plottene som vises på diagonalen. kind-parameteren styrer hovedplottene og er som standard satt til spredningsdiagrammer, mens diag_kind-parameteren styrer de diagonale plottene og velges automatisk avhengig av om hue-parameteren er satt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige verdier for parameteren kind.

diag_kind kan settes til en av følgende verdier:

  • 'auto';

  • 'hist';

  • 'kde';

  • None.

Alt fungerer på samme måte som i funksjonen jointplot() på dette området.

Note
Studer mer
Oppgave

Swipe to start coding

  1. Bruk riktig funksjon for å lage et pair plot.
  2. Angi dataen for plottet til å være penguins_df via det første argumentet.
  3. Angi 'sex' som kolonnen som skal tilordne ulike farger til plottets aspekter ved å spesifisere det andre argumentet.
  4. Angi at ikke-diagonale plott skal ha en regresjonslinje ('reg') ved å spesifisere det tredje argumentet.
  5. Sett height til 2.
  6. Sett aspect til 0.8.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 6

Spør AI

expand
ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

book
Parplott

Note
Definisjon

Pair plot brukes til å visualisere parvise relasjoner mellom numeriske variabler i et datasett. Det ligner på et joint plot, men er ikke begrenset til kun to variabler. En pair plot lager faktisk et NxN-rutenett av Axes-objekter (flere delplott), hvor N er antall numeriske variabler (numeriske kolonner i en DataFrame).

Beskrivelse av Pair Plot

I en pair plot deler hver kolonne den samme x-aksen variabelen, og hver rad deler den samme y-aksen variabelen. Diagonalen viser histogrammer av individuelle variabler, mens de andre plottene viser spredningsdiagrammer.

Opprettelse av Pair Plot

Å opprette en pair plot med seaborn innebærer å kalle funksjonen pairplot(). Den viktigste og eneste påkrevde parameteren er data, som skal være et DataFrame-objekt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
copy

DataFrame-en iris_df sendes til funksjonen pairplot(). Parameterne height og aspect definerer høyden og bredden (beregnet som høyde multiplisert med aspekt) til hver fasett i tommer.

Hue

En annen parameter som er verdt å nevne er hue, som angir variabelen (kolonnenavn) i data for å tilordne plottaspekter til forskjellige farger eller til og med opprette separate plott (på én Axes) for hver av dens verdier.

1234567891011121314
import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
copy

Forskjellen er tydelig her. Datapunktene i hvert spredningsdiagram er farget basert på arten de tilhører, ved å bruke verdiene fra species-kolonnen. De diagonale plottene er nå KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsproblemer er det ofte hensiktsmessig å lage et pair plot med hue-parameteren satt til målvariabelen, som er den kategoriske variabelen vi ønsker å predikere.


Forskjellen er klar. Datapunktene i hvert spredningsdiagram er farget etter arten, basert på verdiene i species-kolonnen. De diagonale plottene er erstattet med KDE-plott for hver art i stedet for histogrammer.

Ved klassifiseringsoppgaver er det ofte nyttig å lage et pair plot med hue-parameteren satt til målvariabelen — den kategoriske variabelen som skal predikeres.

Endre plottyper

Du kan endre typen plott som brukes i stedet for standard spredningsdiagrammer, samt plottene som vises på diagonalen. kind-parameteren styrer hovedplottene og er som standard satt til spredningsdiagrammer, mens diag_kind-parameteren styrer de diagonale plottene og velges automatisk avhengig av om hue-parameteren er satt.

12345678910
import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
copy

'scatter', 'kde', 'hist', 'reg' er mulige verdier for parameteren kind.

diag_kind kan settes til en av følgende verdier:

  • 'auto';

  • 'hist';

  • 'kde';

  • None.

Alt fungerer på samme måte som i funksjonen jointplot() på dette området.

Note
Studer mer
Oppgave

Swipe to start coding

  1. Bruk riktig funksjon for å lage et pair plot.
  2. Angi dataen for plottet til å være penguins_df via det første argumentet.
  3. Angi 'sex' som kolonnen som skal tilordne ulike farger til plottets aspekter ved å spesifisere det andre argumentet.
  4. Angi at ikke-diagonale plott skal ha en regresjonslinje ('reg') ved å spesifisere det tredje argumentet.
  5. Sett height til 2.
  6. Sett aspect til 0.8.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 5. Kapittel 6
Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Vi beklager at noe gikk galt. Hva skjedde?
some-alt