Parplot
Pair plot bruges til at visualisere parvise relationer mellem de numeriske variabler i et datasæt. Det minder meget om et joint plot, men er ikke begrænset til kun to variabler. Faktisk opretter et pair plot et NxN gitter af Axes objekter (flere delplots), hvor N er antallet af numeriske variabler (numeriske kolonner i en DataFrame).
Beskrivelse af Pair Plot
I et pair plot deler hver kolonne den samme x-akse variabel, og hver række deler den samme y-akse variabel. Diagonalen viser histogrammer af individuelle variabler, mens de øvrige plots viser scatter plots.
Oprettelse af et Pair Plot
Oprettelse af et pair plot med seaborn består i at kalde funktionen pairplot(). Dens vigtigste og eneste påkrævede parameter er data, som skal være et DataFrame-objekt.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame iris_df videregives til funktionen pairplot(). Parametrene height og aspect definerer højden og bredden (beregnet som højde multipliceret med aspect) af hver facet i tommer.
Hue
En anden parameter, der er værd at nævne, er hue, som angiver variablen (kolonnenavn) i data, der skal bruges til at tildele forskellige farver til plot-elementer eller endda oprette separate plots (på én Axes) for hver af dens værdier.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Forskellen ses tydeligt her. Datapunkterne i hvert scatter plot er farvet baseret på den art, de tilhører, ved hjælp af værdierne fra species-kolonnen. De diagonale plots er nu KDE plots for hver art i stedet for histogrammer.
Ved klassifikationsproblemer giver det ofte mening at oprette et pair plot med hue-parameteren sat til målvariablen, som er den kategoriske variabel, man ønsker at forudsige.
Forskellen er tydelig. Datapunkterne i hvert scatter plot er farvet efter deres art, baseret på værdierne i species-kolonnen. De diagonale plots er blevet erstattet med KDE plots for hver art i stedet for histogrammer.
Ved klassifikationsopgaver er det ofte nyttigt at oprette et pair plot med hue-parameteren sat til målvariablen — den kategoriske variabel, der skal forudsiges.
Ændring af plottype
Du kan ændre typen af plots, der bruges i stedet for de standard scatter plots, samt de plots, der vises på diagonalen. Parameteren kind styrer hovedplottene og er som standard scatter plots, mens parameteren diag_kind styrer diagonalplots og vælges automatisk baseret på, om parameteren hue er sat.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' er mulige værdier for parameteren kind.
diag_kind kan sættes til en af følgende værdier:
'auto';'hist';'kde';None.
Alt fungerer på samme måde som i funktionen jointplot() i denne sammenhæng.
Udforsk mere i pairplot() dokumentationen.
Swipe to start coding
- Brug den korrekte funktion til at oprette et pair plot.
- Angiv dataene for plottet til at være
penguins_dfvia det første argument. - Angiv
'sex'som kolonnen, der kortlægger plotaspekter til forskellige farver ved at specificere det andet argument. - Angiv, at ikke-diagonale plots skal have en regressionslinje (
'reg') ved at specificere det tredje argument. - Sæt
heighttil2. - Sæt
aspecttil0.8.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.85
Parplot
Stryg for at vise menuen
Pair plot bruges til at visualisere parvise relationer mellem de numeriske variabler i et datasæt. Det minder meget om et joint plot, men er ikke begrænset til kun to variabler. Faktisk opretter et pair plot et NxN gitter af Axes objekter (flere delplots), hvor N er antallet af numeriske variabler (numeriske kolonner i en DataFrame).
Beskrivelse af Pair Plot
I et pair plot deler hver kolonne den samme x-akse variabel, og hver række deler den samme y-akse variabel. Diagonalen viser histogrammer af individuelle variabler, mens de øvrige plots viser scatter plots.
Oprettelse af et Pair Plot
Oprettelse af et pair plot med seaborn består i at kalde funktionen pairplot(). Dens vigtigste og eneste påkrævede parameter er data, som skal være et DataFrame-objekt.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame iris_df videregives til funktionen pairplot(). Parametrene height og aspect definerer højden og bredden (beregnet som højde multipliceret med aspect) af hver facet i tommer.
Hue
En anden parameter, der er værd at nævne, er hue, som angiver variablen (kolonnenavn) i data, der skal bruges til at tildele forskellige farver til plot-elementer eller endda oprette separate plots (på én Axes) for hver af dens værdier.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Forskellen ses tydeligt her. Datapunkterne i hvert scatter plot er farvet baseret på den art, de tilhører, ved hjælp af værdierne fra species-kolonnen. De diagonale plots er nu KDE plots for hver art i stedet for histogrammer.
Ved klassifikationsproblemer giver det ofte mening at oprette et pair plot med hue-parameteren sat til målvariablen, som er den kategoriske variabel, man ønsker at forudsige.
Forskellen er tydelig. Datapunkterne i hvert scatter plot er farvet efter deres art, baseret på værdierne i species-kolonnen. De diagonale plots er blevet erstattet med KDE plots for hver art i stedet for histogrammer.
Ved klassifikationsopgaver er det ofte nyttigt at oprette et pair plot med hue-parameteren sat til målvariablen — den kategoriske variabel, der skal forudsiges.
Ændring af plottype
Du kan ændre typen af plots, der bruges i stedet for de standard scatter plots, samt de plots, der vises på diagonalen. Parameteren kind styrer hovedplottene og er som standard scatter plots, mens parameteren diag_kind styrer diagonalplots og vælges automatisk baseret på, om parameteren hue er sat.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' er mulige værdier for parameteren kind.
diag_kind kan sættes til en af følgende værdier:
'auto';'hist';'kde';None.
Alt fungerer på samme måde som i funktionen jointplot() i denne sammenhæng.
Udforsk mere i pairplot() dokumentationen.
Swipe to start coding
- Brug den korrekte funktion til at oprette et pair plot.
- Angiv dataene for plottet til at være
penguins_dfvia det første argument. - Angiv
'sex'som kolonnen, der kortlægger plotaspekter til forskellige farver ved at specificere det andet argument. - Angiv, at ikke-diagonale plots skal have en regressionslinje (
'reg') ved at specificere det tredje argument. - Sæt
heighttil2. - Sæt
aspecttil0.8.
Løsning
Tak for dine kommentarer!
single