Poikkeamien Esittely
Pyyhkäise näyttääksesi valikon
Poikkeamat ovat epätavallisia havaintoarvoja, jotka eroavat merkittävästi suurimmasta osasta aineistoa. Ne voivat johtua esimerkiksi tietojen syöttövirheistä, luonnollisesta vaihtelusta tai harvinaisista mutta merkittävistä tapahtumista. Poikkeamat voivat vaikuttaa huomattavasti tilastollisiin yhteenvetoihin ja mallinnukseen.
Esimerkiksi yksi suuri poikkeama voi kasvattaa keskiarvoa tai vääristää visualisointien mittakaavaa, mikä voi johtaa harhaanjohtaviin johtopäätöksiin.
Poikkeamien ymmärtäminen ja tunnistaminen on olennainen osa aineiston esikäsittelyä. Analyysin tavoitteesta riippuen poikkeamat voidaan säilyttää, muuntaa tai poistaa kokonaan.
Poikkeamien visualisointi tiheyskäyrillä
Tiheyskäyrä esittää muuttujan jakauman tasaisena käyränä. Huiput osoittavat, missä data keskittyy, kun taas pitkät hännät tai erilliset kohoumat voivat viitata poikkeamiin tai vinouteen.
ggplot(df, aes(x = placement_exam_marks)) +
geom_density(fill = "lightgreen", alpha = 0.7) +
labs(title = "Density Plot Of Placement Exam Marks",
x = "Placement",
y = "Density") +
theme_minimal()
Vinouden mittaaminen
Vinous mittaa jakauman symmetrian tai epäsymmetrian astetta. Tämän avulla voidaan havaita, onko muuttujalla poikkeamia jakauman toisella puolella.
skewness(df$placement_exam_marks)
Vinouman tulkinta
- Vinouma ≈ 0: suunnilleen symmetrinen jakauma;
- Vinouma > 0: oikealle vino jakauma;
- Vinouma < 0: vasemmalle vino jakauma;
- Vinouma > 1: voimakkaasti oikealle vino jakauma;
- Vinouma < -1: voimakkaasti vasemmalle vino jakauma.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme