single
Sfida: Applicare l'Undersampling
Scorri per mostrare il menu
In molti dataset reali, si riscontra spesso un problema di squilibrio tra le classi: una classe (la maggioranza) è molto più numerosa dell'altra (la minoranza). Questo squilibrio può portare i modelli a favorire la previsione della classe di maggioranza, riducendo l'accuratezza predittiva per la classe di minoranza. Una soluzione comune è l'undersampling, che consiste nel ridurre casualmente il numero di campioni della classe di maggioranza per eguagliare il numero della classe di minoranza. Questa esercitazione offre un'esperienza pratica con questa tecnica. Verrà fornito un DataFrame contenente una colonna target categorica con due classi. L'obiettivo è restituire un nuovo DataFrame in cui entrambe le classi siano presenti in numero uguale, ottenuto tramite undersampling casuale della classe di maggioranza.
Scorri per iniziare a programmare
Dato un DataFrame contenente una colonna target categoriale con due classi, restituire un nuovo DataFrame in cui entrambe le classi abbiano lo stesso numero di campioni, sottocampionando casualmente la classe maggioritaria.
- Determinare quale classe è minoritaria e quale è maggioritaria contando il numero di campioni per ciascuna classe.
- Selezionare casualmente campioni dalla classe maggioritaria in modo che il suo conteggio corrisponda a quello della classe minoritaria.
- Concatenare i campioni selezionati casualmente dalla classe maggioritaria con tutti i campioni della classe minoritaria.
- Mescolare il DataFrame risultante e reimpostare l'indice.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione