Finne Korrelasjonen
Til slutt skal vi se på den siste metoden i denne seksjonen, kalt .corr()
. Denne er svært nyttig for å finne sammenhenger mellom numeriske data. Tenk deg at du har et datasett om hus:
La oss undersøke resultatet av data.corr()
i vårt tilfelle:
La oss gå gjennom dette steg for steg: Du har vertikale og horisontale verdier; hvert par overlapper. I hver overlapping kan vi få en verdi fra -1 til 1.
- 1 betyr at to verdier avhenger av hverandre på en direkte proporsjonal måte (hvis én verdi øker, øker den andre også);
- -1 betyr at to verdier avhenger av hverandre på en omvendt proporsjonal måte (hvis én verdi øker, minker den andre);
- 0 betyr at de to avhengige verdiene ikke er proporsjonale.
Hvis datasettet inneholder ikke-numeriske kolonner, slik som i cars.csv
-datasettet brukt i oppgaven, bør du sette argumentet numeric_only=True
for å beregne korrelasjonen kun ved bruk av de numeriske kolonnene.
Swipe to start coding
Du avslutter denne delen med en enkel oppgave: bruk .corr()
-funksjonen på datasettet. Prøv deretter å analysere tallene du får.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.03
Finne Korrelasjonen
Sveip for å vise menyen
Til slutt skal vi se på den siste metoden i denne seksjonen, kalt .corr()
. Denne er svært nyttig for å finne sammenhenger mellom numeriske data. Tenk deg at du har et datasett om hus:
La oss undersøke resultatet av data.corr()
i vårt tilfelle:
La oss gå gjennom dette steg for steg: Du har vertikale og horisontale verdier; hvert par overlapper. I hver overlapping kan vi få en verdi fra -1 til 1.
- 1 betyr at to verdier avhenger av hverandre på en direkte proporsjonal måte (hvis én verdi øker, øker den andre også);
- -1 betyr at to verdier avhenger av hverandre på en omvendt proporsjonal måte (hvis én verdi øker, minker den andre);
- 0 betyr at de to avhengige verdiene ikke er proporsjonale.
Hvis datasettet inneholder ikke-numeriske kolonner, slik som i cars.csv
-datasettet brukt i oppgaven, bør du sette argumentet numeric_only=True
for å beregne korrelasjonen kun ved bruk av de numeriske kolonnene.
Swipe to start coding
Du avslutter denne delen med en enkel oppgave: bruk .corr()
-funksjonen på datasettet. Prøv deretter å analysere tallene du får.
Løsning
Takk for tilbakemeldingene dine!
single