Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Datan Kuvaileminen | Datan Analysointi
Pandas Ensimmäiset Askeleet

bookDatan Kuvaileminen

pandas tarjoaa kätevän mean()-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Samaa menetelmää voi käyttää myös tietyn sarakkeen keskiarvon määrittämiseen:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas tarjoaa myös mode()-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mode_values = df.mode()

Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Huomio

Käytä [0] .mode()-metodin jälkeen saadaksesi ensimmäisen arvon, jos useita moodeja on olemassa. Ilman tätä metodi palauttaa koko Series-olion.

Toinen hyödyllinen pandas-metodi on describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:

  • Kokonaismäärä havaintoja;
  • Keskiarvo;
  • Keskihajonta;
  • Pienin ja suurin arvo;
  • 25., 50. (mediaani) ja 75. prosenttipiste.
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä wine_data.

  • Laske 'residual sugar' -sarakkeen keskiarvo ja tallenna tulos muuttujaan residual_sugar_mean.
  • Laske 'fixed acidity' -sarakkeen moodi ja tallenna tulos muuttujaan fixed_acidity_mode.
  • Hae yleiskatsaus erilaisista tilastollisista arvoista wine_data:sta ja tallenna tulos muuttujaan described_data.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 11
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.03

bookDatan Kuvaileminen

Pyyhkäise näyttääksesi valikon

pandas tarjoaa kätevän mean()-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Samaa menetelmää voi käyttää myös tietyn sarakkeen keskiarvon määrittämiseen:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas tarjoaa myös mode()-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mode_values = df.mode()

Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Huomio

Käytä [0] .mode()-metodin jälkeen saadaksesi ensimmäisen arvon, jos useita moodeja on olemassa. Ilman tätä metodi palauttaa koko Series-olion.

Toinen hyödyllinen pandas-metodi on describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:

  • Kokonaismäärä havaintoja;
  • Keskiarvo;
  • Keskihajonta;
  • Pienin ja suurin arvo;
  • 25., 50. (mediaani) ja 75. prosenttipiste.
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä wine_data.

  • Laske 'residual sugar' -sarakkeen keskiarvo ja tallenna tulos muuttujaan residual_sugar_mean.
  • Laske 'fixed acidity' -sarakkeen moodi ja tallenna tulos muuttujaan fixed_acidity_mode.
  • Hae yleiskatsaus erilaisista tilastollisista arvoista wine_data:sta ja tallenna tulos muuttujaan described_data.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 11
single

single

some-alt