single
Challenge: Aplicar Submuestreo
Desliza para mostrar el menú
En muchos conjuntos de datos del mundo real, a menudo se presenta un problema de desbalance de clases, donde una clase (la mayoritaria) supera ampliamente en cantidad a la otra (la minoritaria). Este desbalance puede sesgar los modelos hacia la predicción de la clase mayoritaria, reduciendo la precisión predictiva para la clase minoritaria. Una solución común es el submuestreo, que consiste en reducir aleatoriamente el número de muestras de la clase mayoritaria para igualar la cantidad de la clase minoritaria. Este desafío te permitirá practicar esta técnica. Recibirás un DataFrame que contiene una columna objetivo categórica con dos clases. El objetivo es devolver un nuevo DataFrame donde ambas clases estén presentes en cantidades iguales, logrado mediante el submuestreo aleatorio de la clase mayoritaria.
Desliza para comenzar a programar
Dado un DataFrame que contiene una columna objetivo categórica con dos clases, devolver un nuevo DataFrame donde ambas clases tengan el mismo número de muestras mediante el submuestreo aleatorio de la clase mayoritaria.
- Identificación de la clase minoritaria y mayoritaria mediante el conteo de muestras para cada clase.
- Selección aleatoria de muestras de la clase mayoritaria para igualar el conteo de la clase minoritaria.
- Concatenación de las muestras seleccionadas aleatoriamente de la clase mayoritaria con todas las muestras de la clase minoritaria.
- Mezcla del DataFrame resultante y restablecimiento del índice.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla