Luku ja Tarkastelu
Ennen kuin voit analysoida dataa, sinun täytyy tuoda se R-ympäristöösi. Useimmissa todellisissa tilanteissa data tallennetaan ulkoisiin tiedostoihin tai tietokantoihin. Ensimmäinen vaihe missä tahansa data-analyysin työnkulussa on tuoda tämä data, jotta voit aloittaa sen tutkimisen ja käsittelyn.
Yleiset datalähteet
Todellisessa maailmassa data tulee usein useista eri lähteistä, kuten:
- CSV (comma-separated values) -tiedostot;
- Excel-taulukot;
- Tekstitiedostot (TXT);
- Tietokannat (esim. SQL, SQLite, PostgreSQL);
- Web-rajapinnat tai muut verkkolähteet.
R tarjoaa useita funktioita ja paketteja, joiden avulla dataa voidaan lukea helposti näistä lähteistä.
CSV-tiedoston lukeminen
CSV on yksi yleisimmin käytetyistä muodoista taulukkomuotoisen datan tallentamiseen. CSV-tiedoston tuomiseen R:ään käytetään yleensä funktiota, joka lukee tiedoston ja tallentaa sen data frameen – rakenteeseen, joka järjestää datan riveihin ja sarakkeisiin.
df <- read_csv("car_details.csv")
Datan tarkastelu
Kun data on ladattu, siitä on hyödyllistä ottaa nopea katsaus. Yksi yksinkertainen tapa tehdä tämä RStudiossa on käyttää View()
-funktiota:
View(df)
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4
Luku ja Tarkastelu
Pyyhkäise näyttääksesi valikon
Ennen kuin voit analysoida dataa, sinun täytyy tuoda se R-ympäristöösi. Useimmissa todellisissa tilanteissa data tallennetaan ulkoisiin tiedostoihin tai tietokantoihin. Ensimmäinen vaihe missä tahansa data-analyysin työnkulussa on tuoda tämä data, jotta voit aloittaa sen tutkimisen ja käsittelyn.
Yleiset datalähteet
Todellisessa maailmassa data tulee usein useista eri lähteistä, kuten:
- CSV (comma-separated values) -tiedostot;
- Excel-taulukot;
- Tekstitiedostot (TXT);
- Tietokannat (esim. SQL, SQLite, PostgreSQL);
- Web-rajapinnat tai muut verkkolähteet.
R tarjoaa useita funktioita ja paketteja, joiden avulla dataa voidaan lukea helposti näistä lähteistä.
CSV-tiedoston lukeminen
CSV on yksi yleisimmin käytetyistä muodoista taulukkomuotoisen datan tallentamiseen. CSV-tiedoston tuomiseen R:ään käytetään yleensä funktiota, joka lukee tiedoston ja tallentaa sen data frameen – rakenteeseen, joka järjestää datan riveihin ja sarakkeisiin.
df <- read_csv("car_details.csv")
Datan tarkastelu
Kun data on ladattu, siitä on hyödyllistä ottaa nopea katsaus. Yksi yksinkertainen tapa tehdä tämä RStudiossa on käyttää View()
-funktiota:
View(df)
Kiitos palautteestasi!