single
Sfida: Applicare l'Oversampling
Scorri per mostrare il menu
In questa sfida, esercizio sulla gestione dello squilibrio tra classi in un grande dataset tramite oversampling. È fornito un DataFrame pandas che contiene una colonna target con classi sbilanciate. L'obiettivo è creare un nuovo DataFrame in cui la classe minoritaria sia sovracampionata, in modo che entrambe le classi abbiano lo stesso numero di righe. Questa tecnica è utile in scenari in cui si desidera evitare che i modelli siano influenzati dalla classe maggioritaria.
Scorri per iniziare a programmare
Dato un DataFrame di pandas con uno squilibrio tra le classi nella colonna target, creare un nuovo DataFrame in cui la classe minoritaria viene sovracampionata affinché ciascuna classe abbia lo stesso numero di righe della classe maggioritaria.
- Identificare il conteggio delle classi nella colonna target.
- Determinare la classe con il conteggio massimo.
- Per ciascuna classe, effettuare un campionamento con reinserimento fino a raggiungere il conteggio massimo.
- Concatenare i sottoinsiemi bilanciati in un nuovo DataFrame.
- Restituire il DataFrame bilanciato.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione