Het Vinden van de Correlatie
Tot slot gaan we naar de laatste methode van deze sectie, genaamd .corr()
. Deze methode is zeer nuttig om de relatie tussen numerieke gegevens te vinden. Stel je voor dat je een dataset over huizen hebt:
Laten we de uitvoer van data.corr()
in ons geval bekijken:
Laten we dit stap voor stap bekijken: Je hebt verticale en horizontale waarden; elk paar overlapt. In elke overlap kunnen we een waarde van -1 tot 1 ontvangen.
- 1 betekent dat twee waarden direct evenredig van elkaar afhankelijk zijn (als de ene waarde toeneemt, neemt de andere ook toe);
- -1 betekent dat twee waarden omgekeerd evenredig van elkaar afhankelijk zijn (als de ene waarde toeneemt, neemt de andere af);
- 0 betekent dat de twee afhankelijke waarden niet evenredig zijn.
Als de dataset niet-numerieke kolommen bevat, zoals in de dataset cars.csv
die in de opdracht wordt gebruikt, moet je het argument numeric_only=True
instellen om de correlatie alleen met de numerieke kolommen te berekenen.
Swipe to start coding
Je sluit deze sectie af met een eenvoudige taak: pas de .corr()
-functie toe op de dataset. Probeer vervolgens de verkregen cijfers te analyseren.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.03
Het Vinden van de Correlatie
Veeg om het menu te tonen
Tot slot gaan we naar de laatste methode van deze sectie, genaamd .corr()
. Deze methode is zeer nuttig om de relatie tussen numerieke gegevens te vinden. Stel je voor dat je een dataset over huizen hebt:
Laten we de uitvoer van data.corr()
in ons geval bekijken:
Laten we dit stap voor stap bekijken: Je hebt verticale en horizontale waarden; elk paar overlapt. In elke overlap kunnen we een waarde van -1 tot 1 ontvangen.
- 1 betekent dat twee waarden direct evenredig van elkaar afhankelijk zijn (als de ene waarde toeneemt, neemt de andere ook toe);
- -1 betekent dat twee waarden omgekeerd evenredig van elkaar afhankelijk zijn (als de ene waarde toeneemt, neemt de andere af);
- 0 betekent dat de twee afhankelijke waarden niet evenredig zijn.
Als de dataset niet-numerieke kolommen bevat, zoals in de dataset cars.csv
die in de opdracht wordt gebruikt, moet je het argument numeric_only=True
instellen om de correlatie alleen met de numerieke kolommen te berekenen.
Swipe to start coding
Je sluit deze sectie af met een eenvoudige taak: pas de .corr()
-functie toe op de dataset. Probeer vervolgens de verkregen cijfers te analyseren.
Oplossing
Bedankt voor je feedback!
single