Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Eliminación de Valores Atípicos Mediante el Método IQR | Análisis Estadístico Básico
Análisis de Datos con R

bookEliminación de Valores Atípicos Mediante el Método IQR

Otra forma eficaz de detectar y eliminar valores atípicos es utilizando el método del rango intercuartílico (IQR).

¿Qué es el IQR?

El rango intercuartílico (IQR) es una medida de dispersión estadística y se calcula como:

IQR=Q3Q1IQR = Q3−Q1

Donde:

  • Q1Q1: percentil 25 (primer cuartil);
  • Q3Q3: percentil 75 (tercer cuartil).

Los valores que se encuentran por debajo de Q11.5×IQRQ1 − 1.5 \times IQR o por encima de Q3+1.5×IQRQ3 + 1.5 \times IQR suelen considerarse valores atípicos.

Cálculo del IQR

Para calcular el valor del IQR y detectar los valores atípicos, primero es necesario conocer los valores del percentil 25 y del percentil 75. Se pueden obtener con la función quantile(). Luego, puede calcular el valor del IQR siguiendo la fórmula.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Identificación de valores atípicos

Similar al método de puntuación z, es necesario identificar los límites inferior y superior:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Luego, puedes seleccionar todos los valores atípicos para analizarlos:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

O crear un conjunto de datos sin valores atípicos:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

¿Qué significa IQR?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Awesome!

Completion rate improved to 4

bookEliminación de Valores Atípicos Mediante el Método IQR

Desliza para mostrar el menú

Otra forma eficaz de detectar y eliminar valores atípicos es utilizando el método del rango intercuartílico (IQR).

¿Qué es el IQR?

El rango intercuartílico (IQR) es una medida de dispersión estadística y se calcula como:

IQR=Q3Q1IQR = Q3−Q1

Donde:

  • Q1Q1: percentil 25 (primer cuartil);
  • Q3Q3: percentil 75 (tercer cuartil).

Los valores que se encuentran por debajo de Q11.5×IQRQ1 − 1.5 \times IQR o por encima de Q3+1.5×IQRQ3 + 1.5 \times IQR suelen considerarse valores atípicos.

Cálculo del IQR

Para calcular el valor del IQR y detectar los valores atípicos, primero es necesario conocer los valores del percentil 25 y del percentil 75. Se pueden obtener con la función quantile(). Luego, puede calcular el valor del IQR siguiendo la fórmula.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Identificación de valores atípicos

Similar al método de puntuación z, es necesario identificar los límites inferior y superior:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Luego, puedes seleccionar todos los valores atípicos para analizarlos:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

O crear un conjunto de datos sin valores atípicos:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

¿Qué significa IQR?

Select the correct answer

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 4
some-alt