Poikkeavien Arvojen Poistaminen IQR-menetelmällä
Toinen tehokas tapa havaita ja poistaa poikkeavia arvoja on käyttää kvartiiliväliä (IQR).
Mikä on IQR?
Kvartiiliväli (IQR) on tilastollisen hajonnan mittari ja se lasketaan seuraavasti:
IQR=Q3−Q1Missä:
- Q1: 25. prosenttipiste (ensimmäinen kvartiili);
- Q3: 75. prosenttipiste (kolmas kvartiili).
Arvot, jotka ovat alle Q1−1.5×IQR tai yli Q3+1.5×IQR, katsotaan tyypillisesti poikkeaviksi arvoiksi.
IQR:n laskeminen
Jotta voit laskea IQR-arvon ja havaita poikkeavat arvot, sinun on ensin tiedettävä 25. ja 75. prosenttipisteen arvot. Ne voidaan saada quantile()
-funktiolla. Tämän jälkeen voit laskea IQR-arvon kaavan mukaisesti.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Poikkeavien arvojen tunnistaminen
Samoin kuin z-pistemäärämenetelmässä, sinun tulee määrittää ala- ja ylärajat:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Tämän jälkeen voit joko valita kaikki poikkeavat arvot analysoitavaksi:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
Tai luoda poikkeamattoman aineiston:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4
Poikkeavien Arvojen Poistaminen IQR-menetelmällä
Pyyhkäise näyttääksesi valikon
Toinen tehokas tapa havaita ja poistaa poikkeavia arvoja on käyttää kvartiiliväliä (IQR).
Mikä on IQR?
Kvartiiliväli (IQR) on tilastollisen hajonnan mittari ja se lasketaan seuraavasti:
IQR=Q3−Q1Missä:
- Q1: 25. prosenttipiste (ensimmäinen kvartiili);
- Q3: 75. prosenttipiste (kolmas kvartiili).
Arvot, jotka ovat alle Q1−1.5×IQR tai yli Q3+1.5×IQR, katsotaan tyypillisesti poikkeaviksi arvoiksi.
IQR:n laskeminen
Jotta voit laskea IQR-arvon ja havaita poikkeavat arvot, sinun on ensin tiedettävä 25. ja 75. prosenttipisteen arvot. Ne voidaan saada quantile()
-funktiolla. Tämän jälkeen voit laskea IQR-arvon kaavan mukaisesti.
q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement
Poikkeavien arvojen tunnistaminen
Samoin kuin z-pistemäärämenetelmässä, sinun tulee määrittää ala- ja ylärajat:
Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)
Tämän jälkeen voit joko valita kaikki poikkeavat arvot analysoitavaksi:
df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]
Tai luoda poikkeamattoman aineiston:
df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
Kiitos palautteestasi!