Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Poikkeamien Esittely | Perustason Tilastollinen Analyysi
Datan Analysointi R:llä

bookPoikkeamien Esittely

Poikkeavat havainnot ovat epätavallisia datapisteitä, jotka poikkeavat merkittävästi suurimmasta osasta aineistoa. Ne voivat johtua tietojen syöttövirheistä, luonnollisesta vaihtelusta tai harvinaisista mutta merkittävistä tapahtumista. Poikkeavat havainnot voivat vaikuttaa huomattavasti tilastollisiin yhteenvetoihin ja mallinnukseen.

Esimerkiksi yksi suuri poikkeava havainto voi kasvattaa keskiarvoa tai vääristää visualisointien mittakaavaa, mikä voi johtaa harhaanjohtaviin johtopäätöksiin.

Poikkeavien havaintojen tunnistaminen ja ymmärtäminen on olennainen osa datan esikäsittelyä. Analyysin tavoitteesta riippuen voit päättää säilyttää, muuntaa tai poistaa poikkeavat havainnot kokonaan.

Poikkeavien havaintojen visualisointi tiheyskäyrillä

Tiheyskäyrä tarjoaa tasaisen käyrän, joka kuvaa muuttujan jakaumaa. Huiput osoittavat, missä data keskittyy, kun taas pitkät hännät tai erilliset kohoumat voivat viitata poikkeaviin havaintoihin tai vinouteen.

ggplot(df, aes(x = placement_exam_marks)) +
  geom_density(fill = "lightgreen", alpha = 0.7) +
  labs(title = "Density Plot Of Placement Exam Marks",
       x = "Placement",
       y = "Density") +
  theme_minimal()

Vinouden mittaaminen

Vinous mittaa jakauman symmetrian tai epäsymmetrian astetta. Tämä auttaa havaitsemaan, onko muuttujalla poikkeavia havaintoja jakauman toisella puolella.

skewness(df$placement_exam_marks)

Vinouman tulkinta

  • Vinouma ≈ 0: suunnilleen symmetrinen jakauma;
  • Vinouma > 0: oikealle vino jakauma;
  • Vinouma < 0: vasemmalle vino jakauma;
  • Vinouma > 1: voimakkaasti oikealle vino jakauma;
  • Vinouma < -1: voimakkaasti vasemmalle vino jakauma.
question mark

Jos muuttujalla on skewness > 1, sitä pidetään:

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4

bookPoikkeamien Esittely

Pyyhkäise näyttääksesi valikon

Poikkeavat havainnot ovat epätavallisia datapisteitä, jotka poikkeavat merkittävästi suurimmasta osasta aineistoa. Ne voivat johtua tietojen syöttövirheistä, luonnollisesta vaihtelusta tai harvinaisista mutta merkittävistä tapahtumista. Poikkeavat havainnot voivat vaikuttaa huomattavasti tilastollisiin yhteenvetoihin ja mallinnukseen.

Esimerkiksi yksi suuri poikkeava havainto voi kasvattaa keskiarvoa tai vääristää visualisointien mittakaavaa, mikä voi johtaa harhaanjohtaviin johtopäätöksiin.

Poikkeavien havaintojen tunnistaminen ja ymmärtäminen on olennainen osa datan esikäsittelyä. Analyysin tavoitteesta riippuen voit päättää säilyttää, muuntaa tai poistaa poikkeavat havainnot kokonaan.

Poikkeavien havaintojen visualisointi tiheyskäyrillä

Tiheyskäyrä tarjoaa tasaisen käyrän, joka kuvaa muuttujan jakaumaa. Huiput osoittavat, missä data keskittyy, kun taas pitkät hännät tai erilliset kohoumat voivat viitata poikkeaviin havaintoihin tai vinouteen.

ggplot(df, aes(x = placement_exam_marks)) +
  geom_density(fill = "lightgreen", alpha = 0.7) +
  labs(title = "Density Plot Of Placement Exam Marks",
       x = "Placement",
       y = "Density") +
  theme_minimal()

Vinouden mittaaminen

Vinous mittaa jakauman symmetrian tai epäsymmetrian astetta. Tämä auttaa havaitsemaan, onko muuttujalla poikkeavia havaintoja jakauman toisella puolella.

skewness(df$placement_exam_marks)

Vinouman tulkinta

  • Vinouma ≈ 0: suunnilleen symmetrinen jakauma;
  • Vinouma > 0: oikealle vino jakauma;
  • Vinouma < 0: vasemmalle vino jakauma;
  • Vinouma > 1: voimakkaasti oikealle vino jakauma;
  • Vinouma < -1: voimakkaasti vasemmalle vino jakauma.
question mark

Jos muuttujalla on skewness > 1, sitä pidetään:

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 2
some-alt