Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Luku ja Tarkastelu | Datan Käsittely ja Puhdistus
Datan analysointi R:llä

bookLuku ja Tarkastelu

Ennen kuin voit analysoida dataa, sinun täytyy tuoda se R-ympäristöösi. Useimmissa todellisissa tilanteissa data tallennetaan ulkoisiin tiedostoihin tai tietokantoihin. Ensimmäinen vaihe missä tahansa data-analyysin työnkulussa on tuoda tämä data, jotta voit aloittaa sen tutkimisen ja käsittelyn.

Yleiset datalähteet

Todellisessa maailmassa data tulee usein useista eri lähteistä, kuten:

  • CSV (comma-separated values) -tiedostot;
  • Excel-taulukot;
  • Tekstitiedostot (TXT);
  • Tietokannat (esim. SQL, SQLite, PostgreSQL);
  • Web-rajapinnat tai muut verkkolähteet.

R tarjoaa useita funktioita ja paketteja, joiden avulla dataa voidaan lukea helposti näistä lähteistä.

CSV-tiedoston lukeminen

CSV on yksi yleisimmin käytetyistä muodoista taulukkomuotoisen datan tallentamiseen. CSV-tiedoston tuomiseen R:ään käytetään yleensä funktiota, joka lukee tiedoston ja tallentaa sen data frameen – rakenteeseen, joka järjestää datan riveihin ja sarakkeisiin.

df <- read_csv("car_details.csv")

Datan tarkastelu

Kun data on ladattu, siitä on hyödyllistä ottaa nopea katsaus. Yksi yksinkertainen tapa tehdä tämä RStudiossa on käyttää View()-funktiota:

View(df)
question mark

Mikä funktio lukee CSV-tiedostoja tidyversessä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4

bookLuku ja Tarkastelu

Pyyhkäise näyttääksesi valikon

Ennen kuin voit analysoida dataa, sinun täytyy tuoda se R-ympäristöösi. Useimmissa todellisissa tilanteissa data tallennetaan ulkoisiin tiedostoihin tai tietokantoihin. Ensimmäinen vaihe missä tahansa data-analyysin työnkulussa on tuoda tämä data, jotta voit aloittaa sen tutkimisen ja käsittelyn.

Yleiset datalähteet

Todellisessa maailmassa data tulee usein useista eri lähteistä, kuten:

  • CSV (comma-separated values) -tiedostot;
  • Excel-taulukot;
  • Tekstitiedostot (TXT);
  • Tietokannat (esim. SQL, SQLite, PostgreSQL);
  • Web-rajapinnat tai muut verkkolähteet.

R tarjoaa useita funktioita ja paketteja, joiden avulla dataa voidaan lukea helposti näistä lähteistä.

CSV-tiedoston lukeminen

CSV on yksi yleisimmin käytetyistä muodoista taulukkomuotoisen datan tallentamiseen. CSV-tiedoston tuomiseen R:ään käytetään yleensä funktiota, joka lukee tiedoston ja tallentaa sen data frameen – rakenteeseen, joka järjestää datan riveihin ja sarakkeisiin.

df <- read_csv("car_details.csv")

Datan tarkastelu

Kun data on ladattu, siitä on hyödyllistä ottaa nopea katsaus. Yksi yksinkertainen tapa tehdä tämä RStudiossa on käyttää View()-funktiota:

View(df)
question mark

Mikä funktio lukee CSV-tiedostoja tidyversessä?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3
some-alt