Datan Kuvaileminen
pandas
tarjoaa kätevän mean()
-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Voit käyttää samaa menetelmää määrittääksesi tietyn sarakkeen keskiarvon:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas
tarjoaa myös mode()
-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Käytämme [0] .mode()-metodin jälkeen poimiaksemme ensimmäisen arvon, jos useita moodeja esiintyy. Ilman tätä metodi palauttaa koko Series-olion.
Toinen hyödyllinen metodi pandas
-kirjastossa on describe()
.
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:
- Kokonaismäärä havaintoja;
- Keskiarvo;
- Keskihajonta;
- Pienin ja suurin arvo;
- 25., 50. (mediaani) ja 75. prosenttipiste.
Swipe to start coding
Sinulle on annettu DataFrame
nimeltä wine_data
.
- Laske
'residual sugar'
-sarakkeen keskiarvo ja tallenna tulos muuttujaanresidual_sugar_mean
. - Laske
'fixed acidity'
-sarakkeen moodi ja tallenna tulos muuttujaanfixed_acidity_mode
. - Hae yleiskatsaus erilaisista tilastollisista tunnusluvuista
wine_data
:sta ja tallenna tulos muuttujaandescribed_data
.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.03
Datan Kuvaileminen
Pyyhkäise näyttääksesi valikon
pandas
tarjoaa kätevän mean()
-menetelmän, joka laskee keskiarvon kaikista arvoista jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mean_values = df.mean()
Voit käyttää samaa menetelmää määrittääksesi tietyn sarakkeen keskiarvon:
df = pd.read_csv(file.csv)
mean_values = df['column_name'].mean()
pandas
tarjoaa myös mode()
-menetelmän, joka tunnistaa yleisimmin esiintyvän arvon jokaisessa sarakkeessa.
df = pd.read_csv(file.csv)
mode_values = df.mode()
Tietyn sarakkeen moodin löytämiseen käytetään samaa menetelmää:
df = pd.read_csv(file.csv)
mode_values = df['column_name'].mode()[0]
Käytämme [0] .mode()-metodin jälkeen poimiaksemme ensimmäisen arvon, jos useita moodeja esiintyy. Ilman tätä metodi palauttaa koko Series-olion.
Toinen hyödyllinen metodi pandas
-kirjastossa on describe()
.
df = pd.read_csv(file.csv)
important_metrics = df.describe()
Tämä menetelmä tarjoaa yleiskatsauksen eri mittareista tietoaineistosta, mukaan lukien:
- Kokonaismäärä havaintoja;
- Keskiarvo;
- Keskihajonta;
- Pienin ja suurin arvo;
- 25., 50. (mediaani) ja 75. prosenttipiste.
Swipe to start coding
Sinulle on annettu DataFrame
nimeltä wine_data
.
- Laske
'residual sugar'
-sarakkeen keskiarvo ja tallenna tulos muuttujaanresidual_sugar_mean
. - Laske
'fixed acidity'
-sarakkeen moodi ja tallenna tulos muuttujaanfixed_acidity_mode
. - Hae yleiskatsaus erilaisista tilastollisista tunnusluvuista
wine_data
:sta ja tallenna tulos muuttujaandescribed_data
.
Ratkaisu
Kiitos palautteestasi!
Awesome!
Completion rate improved to 3.03single