Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Challenge: Toepassen van Oversampling | Bemonsteringstechnieken voor Grote Data
Grote Data Verwerking met Python
Sectie 2. Hoofdstuk 4
single

single

Challenge: Toepassen van Oversampling

Veeg om het menu te tonen

In deze uitdaging oefen je met het omgaan met klasse-ongelijkheid in een grote dataset door oversampling toe te passen. Je krijgt een pandas DataFrame met een doeldkolom waarin de klassen ongelijk verdeeld zijn. Het doel is om een nieuwe DataFrame te maken waarin de minderheidsklasse wordt overbemonsterd, zodat beide klassen evenveel rijen bevatten. Deze techniek is nuttig in situaties waarin je wilt voorkomen dat modellen bevooroordeeld raken richting de meerderheidklasse.

Taak

Veeg om te beginnen met coderen

Gegeven een pandas DataFrame met een klassenonevenwicht in de targetkolom, maak een nieuwe DataFrame waarbij de minderheidsklasse wordt overgesampled zodat elke klasse evenveel rijen heeft als de meerderheidklasse.

  • Identificatie van het aantal rijen per klasse in de targetkolom.
  • Bepaling van de klasse met het hoogste aantal rijen.
  • Voor elke klasse, steekproeven met teruglegging om het maximale aantal te bereiken.
  • Samenvoegen van de gebalanceerde subsets tot een nieuwe DataFrame.
  • Retourneren van de gebalanceerde DataFrame.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 2. Hoofdstuk 4
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

some-alt