Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Poikkeavien Arvojen Poistaminen IQR-menetelmällä | Perustason Tilastollinen Analyysi
Datan analysointi R:llä

bookPoikkeavien Arvojen Poistaminen IQR-menetelmällä

Toinen tehokas tapa havaita ja poistaa poikkeavia arvoja on käyttää kvartiiliväliä (IQR).

Mikä on IQR?

Kvartiiliväli (IQR) on tilastollisen hajonnan mittari ja se lasketaan seuraavasti:

IQR=Q3Q1IQR = Q3−Q1

Missä:

  • Q1Q1: 25. prosenttipiste (ensimmäinen kvartiili);
  • Q3Q3: 75. prosenttipiste (kolmas kvartiili).

Arvot, jotka ovat alle Q11.5×IQRQ1 − 1.5 \times IQR tai yli Q3+1.5×IQRQ3 + 1.5 \times IQR, katsotaan tyypillisesti poikkeaviksi arvoiksi.

IQR:n laskeminen

Jotta voit laskea IQR-arvon ja havaita poikkeavat arvot, sinun on ensin tiedettävä 25. ja 75. prosenttipisteen arvot. Ne voidaan saada quantile()-funktiolla. Tämän jälkeen voit laskea IQR-arvon kaavan mukaisesti.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Poikkeavien arvojen tunnistaminen

Samoin kuin z-pistemäärämenetelmässä, sinun tulee määrittää ala- ja ylärajat:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Tämän jälkeen voit joko valita kaikki poikkeavat arvot analysoitavaksi:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

Tai luoda poikkeamattoman aineiston:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

Mitä IQR tarkoittaa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 4

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4

bookPoikkeavien Arvojen Poistaminen IQR-menetelmällä

Pyyhkäise näyttääksesi valikon

Toinen tehokas tapa havaita ja poistaa poikkeavia arvoja on käyttää kvartiiliväliä (IQR).

Mikä on IQR?

Kvartiiliväli (IQR) on tilastollisen hajonnan mittari ja se lasketaan seuraavasti:

IQR=Q3Q1IQR = Q3−Q1

Missä:

  • Q1Q1: 25. prosenttipiste (ensimmäinen kvartiili);
  • Q3Q3: 75. prosenttipiste (kolmas kvartiili).

Arvot, jotka ovat alle Q11.5×IQRQ1 − 1.5 \times IQR tai yli Q3+1.5×IQRQ3 + 1.5 \times IQR, katsotaan tyypillisesti poikkeaviksi arvoiksi.

IQR:n laskeminen

Jotta voit laskea IQR-arvon ja havaita poikkeavat arvot, sinun on ensin tiedettävä 25. ja 75. prosenttipisteen arvot. Ne voidaan saada quantile()-funktiolla. Tämän jälkeen voit laskea IQR-arvon kaavan mukaisesti.

q1_placement <- quantile(df$placement_exam_marks, 0.25)
q3_placement <- quantile(df$placement_exam_marks, 0.75)
iqr_placement <- q3_placement - q1_placement

Poikkeavien arvojen tunnistaminen

Samoin kuin z-pistemäärämenetelmässä, sinun tulee määrittää ala- ja ylärajat:

Thresh_hold <- 1.5
upper_boundary <- q3_placement + (Thresh_hold * iqr_placement)
lower_boundary <- q1_placement - (Thresh_hold * iqr_placement)

Tämän jälkeen voit joko valita kaikki poikkeavat arvot analysoitavaksi:

df[df$placement_exam_marks > upper_boundary | df$placement_exam_marks < lower_boundary,]

Tai luoda poikkeamattoman aineiston:

df2 <- df[df$placement_exam_marks <= upper_boundary & df$placement_exam_marks >= lower_boundary,]
question mark

Mitä IQR tarkoittaa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 4
some-alt