Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Datan Kuvaileminen | Datan Analysointi
Pandas Ensimmäiset Askeleet

bookDatan Kuvaileminen

pandas tarjoaa kätevän mean()-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Voit käyttää samaa menetelmää määrittääksesi tietyn sarakkeen keskiarvon:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas tarjoaa myös mode()-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mode_values = df.mode()

Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Huomio

Käytämme [0] .mode()-metodin jälkeen poimiaksemme ensimmäisen arvon, jos useita moodeja esiintyy. Ilman tätä metodi palauttaa koko Series-olion.

Toinen hyödyllinen metodi pandas-kirjastossa on describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:

  • Kokonaismäärä havaintoja;
  • Keskiarvo;
  • Keskihajonta;
  • Pienin ja suurin arvo;
  • 25., 50. (mediaani) ja 75. prosenttipiste.
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä wine_data.

  • Laske 'residual sugar' -sarakkeen keskiarvo ja tallenna tulos muuttujaan residual_sugar_mean.
  • Laske 'fixed acidity' -sarakkeen moodi ja tallenna tulos muuttujaan fixed_acidity_mode.
  • Hae yleiskatsaus erilaisista tilastollisista tunnusluvuista wine_data:sta ja tallenna tulos muuttujaan described_data.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 11
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.03

bookDatan Kuvaileminen

Pyyhkäise näyttääksesi valikon

pandas tarjoaa kätevän mean()-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mean_values = df.mean()

Voit käyttää samaa menetelmää määrittääksesi tietyn sarakkeen keskiarvon:

df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()

pandas tarjoaa myös mode()-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.

df = pd.read_csv(file.csv)
mode_values = df.mode()

Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:

df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Note
Huomio

Käytämme [0] .mode()-metodin jälkeen poimiaksemme ensimmäisen arvon, jos useita moodeja esiintyy. Ilman tätä metodi palauttaa koko Series-olion.

Toinen hyödyllinen metodi pandas-kirjastossa on describe().

df = pd.read_csv(file.csv)
important_metrics = df.describe()

Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:

  • Kokonaismäärä havaintoja;
  • Keskiarvo;
  • Keskihajonta;
  • Pienin ja suurin arvo;
  • 25., 50. (mediaani) ja 75. prosenttipiste.
Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä wine_data.

  • Laske 'residual sugar' -sarakkeen keskiarvo ja tallenna tulos muuttujaan residual_sugar_mean.
  • Laske 'fixed acidity' -sarakkeen moodi ja tallenna tulos muuttujaan fixed_acidity_mode.
  • Hae yleiskatsaus erilaisista tilastollisista tunnusluvuista wine_data:sta ja tallenna tulos muuttujaan described_data.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

close

Awesome!

Completion rate improved to 3.03
Osio 3. Luku 11
single

single

some-alt