single
Challenge: Toepassen van Oversampling
Veeg om het menu te tonen
In deze uitdaging oefen je met het omgaan met klasse-ongelijkheid in een grote dataset door oversampling toe te passen. Je krijgt een pandas DataFrame met een doeldkolom waarin de klassen ongelijk verdeeld zijn. Het doel is om een nieuwe DataFrame te maken waarin de minderheidsklasse wordt overbemonsterd, zodat beide klassen evenveel rijen bevatten. Deze techniek is nuttig in situaties waarin je wilt voorkomen dat modellen bevooroordeeld raken richting de meerderheidklasse.
Veeg om te beginnen met coderen
Gegeven een pandas DataFrame met een klassenonevenwicht in de targetkolom, maak een nieuwe DataFrame waarbij de minderheidsklasse wordt overgesampled zodat elke klasse evenveel rijen heeft als de meerderheidklasse.
- Identificatie van het aantal rijen per klasse in de targetkolom.
- Bepaling van de klasse met het hoogste aantal rijen.
- Voor elke klasse, steekproeven met teruglegging om het maximale aantal te bereiken.
- Samenvoegen van de gebalanceerde subsets tot een nieuwe DataFrame.
- Retourneren van de gebalanceerde DataFrame.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.