Parplott
Pair plot brukes til å visualisere parvise relasjoner mellom numeriske variabler i et datasett. Det ligner på et joint plot, men er ikke begrenset til kun to variabler. Et pair plot lager faktisk et NxN-rutenett av Axes-objekter (flere underplott), der N er antall numeriske variabler (numeriske kolonner i en DataFrame).
Beskrivelse av pair plot
I et pair plot deler hver kolonne den samme x-aksen-variabelen, og hver rad deler den samme y-aksen-variabelen. Diagonalen viser histogrammer av individuelle variabler, mens de andre plottene viser scatter plots.
Opprette et Pair Plot
Å opprette et pair plot med seaborn innebærer å kalle funksjonen pairplot(). Den viktigste og eneste påkrevde parameteren er data, som skal være et DataFrame-objekt.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame-en iris_df sendes til funksjonen pairplot(). Parameterne height og aspect definerer høyden og bredden (beregnet som høyde multiplisert med aspect) for hver fasett i tommer.
Hue
En annen parameter som er verdt å nevne er hue, som angir variabelen (kolonnenavn) i data som skal brukes til å tilordne ulike farger eller til og med lage separate plott (på én Axes) for hver av dens verdier.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Forskjellen er tydelig her. Datapunktene i hvert spredningsplott er fargelagt basert på arten de tilhører, ved å bruke verdiene fra species-kolonnen. De diagonale plott er nå KDE-plott for hver art i stedet for histogrammer.
Ved klassifiseringsproblemer er det ofte hensiktsmessig å lage et pair plot med hue-parameteren satt til målvariabelen, som er den kategoriske variabelen vi ønsker å predikere.
Forskjellen er tydelig. Datapunktene i hvert spredningsplott er fargelagt etter arten, basert på verdiene i species-kolonnen. De diagonale plott er erstattet med KDE-plott for hver art i stedet for histogrammer.
Ved klassifiseringsoppgaver er det ofte nyttig å lage et pair plot med hue-parameteren satt til målvariabelen — den kategoriske variabelen som skal predikeres.
Endring av plott-typer
Du kan endre typen plott som brukes i stedet for standard spredningsplott, samt plottet som vises på diagonalen. Parameteren kind styrer hovedplottene og er som standard satt til spredningsplott, mens parameteren diag_kind styrer diagonalplottene og velges automatisk avhengig av om parameteren hue er satt.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' er mulige verdier for parameteren kind.
diag_kind kan settes til en av følgende verdier:
'auto';'hist';'kde';None.
Alt fungerer på samme måte som for funksjonen jointplot() i denne sammenhengen.
Utforsk mer i pairplot() dokumentasjonen.
Swipe to start coding
- Bruk riktig funksjon for å lage et pair plot.
- Angi dataen for plottet til å være
penguins_dfvia det første argumentet. - Angi
'sex'som kolonnen som skal tilordne ulike farger til plottet ved å spesifisere det andre argumentet. - Angi at ikke-diagonale plott skal ha en regresjonslinje (
'reg') ved å spesifisere det tredje argumentet. - Sett
heighttil2. - Sett
aspecttil0.8.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
What other parameters can I use with the pairplot() function?
Can you explain the difference between 'kind' and 'diag_kind' in more detail?
How do I interpret the KDE plots on the diagonal?
Awesome!
Completion rate improved to 3.85
Parplott
Sveip for å vise menyen
Pair plot brukes til å visualisere parvise relasjoner mellom numeriske variabler i et datasett. Det ligner på et joint plot, men er ikke begrenset til kun to variabler. Et pair plot lager faktisk et NxN-rutenett av Axes-objekter (flere underplott), der N er antall numeriske variabler (numeriske kolonner i en DataFrame).
Beskrivelse av pair plot
I et pair plot deler hver kolonne den samme x-aksen-variabelen, og hver rad deler den samme y-aksen-variabelen. Diagonalen viser histogrammer av individuelle variabler, mens de andre plottene viser scatter plots.
Opprette et Pair Plot
Å opprette et pair plot med seaborn innebærer å kalle funksjonen pairplot(). Den viktigste og eneste påkrevde parameteren er data, som skal være et DataFrame-objekt.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Creating a pair plot sns.pairplot(iris_df, height=2, aspect=0.8) plt.show()
DataFrame-en iris_df sendes til funksjonen pairplot(). Parameterne height og aspect definerer høyden og bredden (beregnet som høyde multiplisert med aspect) for hver fasett i tommer.
Hue
En annen parameter som er verdt å nevne er hue, som angir variabelen (kolonnenavn) i data som skal brukes til å tilordne ulike farger eller til og med lage separate plott (på én Axes) for hver av dens verdier.
1234567891011121314import seaborn as sns import matplotlib.pyplot as plt # Ignoring warnings import warnings warnings.filterwarnings('ignore') # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the hue parameter to 'species' sns.pairplot(iris_df, hue='species', height=2, aspect=0.8) plt.show()
Forskjellen er tydelig her. Datapunktene i hvert spredningsplott er fargelagt basert på arten de tilhører, ved å bruke verdiene fra species-kolonnen. De diagonale plott er nå KDE-plott for hver art i stedet for histogrammer.
Ved klassifiseringsproblemer er det ofte hensiktsmessig å lage et pair plot med hue-parameteren satt til målvariabelen, som er den kategoriske variabelen vi ønsker å predikere.
Forskjellen er tydelig. Datapunktene i hvert spredningsplott er fargelagt etter arten, basert på verdiene i species-kolonnen. De diagonale plott er erstattet med KDE-plott for hver art i stedet for histogrammer.
Ved klassifiseringsoppgaver er det ofte nyttig å lage et pair plot med hue-parameteren satt til målvariabelen — den kategoriske variabelen som skal predikeres.
Endring av plott-typer
Du kan endre typen plott som brukes i stedet for standard spredningsplott, samt plottet som vises på diagonalen. Parameteren kind styrer hovedplottene og er som standard satt til spredningsplott, mens parameteren diag_kind styrer diagonalplottene og velges automatisk avhengig av om parameteren hue er satt.
12345678910import seaborn as sns import matplotlib.pyplot as plt # Loading the dataset with data about three different iris species iris_df = sns.load_dataset('iris') # Setting the kind parameter and diag_kind parameters sns.pairplot(iris_df, hue='species', kind='reg', diag_kind=None, height=2, aspect=0.8) plt.show()
'scatter', 'kde', 'hist', 'reg' er mulige verdier for parameteren kind.
diag_kind kan settes til en av følgende verdier:
'auto';'hist';'kde';None.
Alt fungerer på samme måte som for funksjonen jointplot() i denne sammenhengen.
Utforsk mer i pairplot() dokumentasjonen.
Swipe to start coding
- Bruk riktig funksjon for å lage et pair plot.
- Angi dataen for plottet til å være
penguins_dfvia det første argumentet. - Angi
'sex'som kolonnen som skal tilordne ulike farger til plottet ved å spesifisere det andre argumentet. - Angi at ikke-diagonale plott skal ha en regresjonslinje (
'reg') ved å spesifisere det tredje argumentet. - Sett
heighttil2. - Sett
aspecttil0.8.
Løsning
Takk for tilbakemeldingene dine!
single