Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Sfida: Applicare l'Oversampling | Tecniche di campionamento per grandi dati
Gestione di Grandi Dati con Python
Sezione 2. Capitolo 4
single

single

Sfida: Applicare l'Oversampling

Scorri per mostrare il menu

In questa sfida, esercizio sulla gestione dello squilibrio tra classi in un grande dataset tramite oversampling. È fornito un DataFrame pandas che contiene una colonna target con classi sbilanciate. L'obiettivo è creare un nuovo DataFrame in cui la classe minoritaria sia sovracampionata, in modo che entrambe le classi abbiano lo stesso numero di righe. Questa tecnica è utile in scenari in cui si desidera evitare che i modelli siano influenzati dalla classe maggioritaria.

Compito

Scorri per iniziare a programmare

Dato un DataFrame di pandas con uno squilibrio tra le classi nella colonna target, creare un nuovo DataFrame in cui la classe minoritaria viene sovracampionata affinché ciascuna classe abbia lo stesso numero di righe della classe maggioritaria.

  • Identificare il conteggio delle classi nella colonna target.
  • Determinare la classe con il conteggio massimo.
  • Per ciascuna classe, effettuare un campionamento con reinserimento fino a raggiungere il conteggio massimo.
  • Concatenare i sottoinsiemi bilanciati in un nuovo DataFrame.
  • Restituire il DataFrame bilanciato.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 4
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

some-alt