Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Luku ja Tarkastelu | Datan Käsittely ja Puhdistus
Datan Analysointi R:llä

bookLuku ja Tarkastelu

Ennen kuin voit analysoida dataa, sinun täytyy tuoda se R-ympäristöösi. Useimmissa todellisissa tilanteissa data tallennetaan ulkoisiin tiedostoihin tai tietokantoihin. Ensimmäinen vaihe missä tahansa data-analyysin työnkulussa on tuoda tämä data, jotta voit aloittaa sen tutkimisen ja käsittelyn.

Yleiset datalähteet

Todellisen maailman data tulee usein useista eri lähteistä, kuten:

  • CSV (pilkuin erotetut arvot) -tiedostot;
  • Excel-taulukot;
  • Tekstitiedostot (TXT);
  • Tietokannat (esim. SQL, SQLite, PostgreSQL);
  • Web-rajapinnat tai muut verkkolähteet.

R tarjoaa useita funktioita ja paketteja, joiden avulla dataa voidaan lukea helposti näistä lähteistä.

CSV-tiedoston lukeminen

CSV on yksi yleisimmin käytetyistä muodoista taulukkomuotoisen datan tallentamiseen. CSV-tiedoston tuomiseksi R:ään käytetään yleensä funktiota, joka lukee tiedoston ja tallentaa sen data frameen – rakenteeseen, joka järjestää datan riveihin ja sarakkeisiin.

df <- read_csv("car_details.csv")

Datan tarkastelu

Kun data on ladattu, on hyödyllistä tarkastella sitä nopeasti. Yksi yksinkertainen tapa tehdä tämä RStudiossa on käyttää View()-funktiota:

View(df)
question mark

Mikä funktio lukee CSV-tiedostoja tidyversessä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookLuku ja Tarkastelu

Pyyhkäise näyttääksesi valikon

Ennen kuin voit analysoida dataa, sinun täytyy tuoda se R-ympäristöösi. Useimmissa todellisissa tilanteissa data tallennetaan ulkoisiin tiedostoihin tai tietokantoihin. Ensimmäinen vaihe missä tahansa data-analyysin työnkulussa on tuoda tämä data, jotta voit aloittaa sen tutkimisen ja käsittelyn.

Yleiset datalähteet

Todellisen maailman data tulee usein useista eri lähteistä, kuten:

  • CSV (pilkuin erotetut arvot) -tiedostot;
  • Excel-taulukot;
  • Tekstitiedostot (TXT);
  • Tietokannat (esim. SQL, SQLite, PostgreSQL);
  • Web-rajapinnat tai muut verkkolähteet.

R tarjoaa useita funktioita ja paketteja, joiden avulla dataa voidaan lukea helposti näistä lähteistä.

CSV-tiedoston lukeminen

CSV on yksi yleisimmin käytetyistä muodoista taulukkomuotoisen datan tallentamiseen. CSV-tiedoston tuomiseksi R:ään käytetään yleensä funktiota, joka lukee tiedoston ja tallentaa sen data frameen – rakenteeseen, joka järjestää datan riveihin ja sarakkeisiin.

df <- read_csv("car_details.csv")

Datan tarkastelu

Kun data on ladattu, on hyödyllistä tarkastella sitä nopeasti. Yksi yksinkertainen tapa tehdä tämä RStudiossa on käyttää View()-funktiota:

View(df)
question mark

Mikä funktio lukee CSV-tiedostoja tidyversessä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3
some-alt