Eliminación de Valores Atípicos Mediante el Método IQR
Otra forma eficaz de detectar y eliminar valores atípicos es utilizando el método del rango intercuartílico (IQR).
¿Qué es el IQR?
El rango intercuartílico (IQR) es una medida de dispersión estadística y se calcula como:
IQR=Q3−Q1Donde:
- Q1: percentil 25 (primer cuartil);
- Q3: percentil 75 (tercer cuartil).
Los valores que se encuentran por debajo de Q1−1.5×IQR o por encima de Q3+1.5×IQR suelen considerarse valores atípicos.
Cálculo del IQR
Para calcular el valor del IQR y detectar los valores atípicos, primero es necesario conocer los valores del percentil 25 y del percentil 75. Se pueden obtener con la función quantile()
. Luego, puede calcular el valor del IQR siguiendo la fórmula.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Identificación de valores atípicos
Similar al método de puntuación z, es necesario identificar los límites inferior y superior:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Luego, puedes seleccionar todos los valores atípicos para analizarlos:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
O crear un conjunto de datos sin valores atípicos:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 4
Eliminación de Valores Atípicos Mediante el Método IQR
Desliza para mostrar el menú
Otra forma eficaz de detectar y eliminar valores atípicos es utilizando el método del rango intercuartílico (IQR).
¿Qué es el IQR?
El rango intercuartílico (IQR) es una medida de dispersión estadística y se calcula como:
IQR=Q3−Q1Donde:
- Q1: percentil 25 (primer cuartil);
- Q3: percentil 75 (tercer cuartil).
Los valores que se encuentran por debajo de Q1−1.5×IQR o por encima de Q3+1.5×IQR suelen considerarse valores atípicos.
Cálculo del IQR
Para calcular el valor del IQR y detectar los valores atípicos, primero es necesario conocer los valores del percentil 25 y del percentil 75. Se pueden obtener con la función quantile()
. Luego, puede calcular el valor del IQR siguiendo la fórmula.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Identificación de valores atípicos
Similar al método de puntuación z, es necesario identificar los límites inferior y superior:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Luego, puedes seleccionar todos los valores atípicos para analizarlos:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
O crear un conjunto de datos sin valores atípicos:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
¡Gracias por tus comentarios!