Sum() og Count()
pandas
tilbyr metoden count()
, som teller alle ikke-null celler (verken None
eller NaN
) for hver kolonne.
python912df = pd.read_csv(file.csv)number_of_cells = df.count()
For å finne antallet ikke-null verdier i en spesifikk kolonne, bruk følgende syntaks:
python912df = pd.read_csv(file.csv)number_of_cells = df['name of the column'].count()
pandas
gir også metoden sum()
. Denne metoden beregner summen av verdier for hver kolonne, men den fungerer bare med numeriske eller boolske kolonner.
python912df = pd.read_csv(file.csv)total = df.sum()
Siden metoden isna()
returnerer en boolsk DataFrame, kan du bruke følgende syntaks for å beregne antall manglende verdier for hver av kolonnene:
pythonmissing_values_count = df.isna().sum()
For å finne summen av verdier i en bestemt kolonne, bruk følgende syntaks:
python912df = pd.read_csv(file.csv)total = df['name of the column'].sum()
Oppgave
Swipe to start coding
Du har fått en DataFrame
kalt audi_cars
.
- Få antall ikke-null celler i hver kolonne og lagre resultatet i variabelen
number_of_cells
. - Beregn totalprisen (ved å bruke
'price'
-kolonnen) for alle biler iDataFrame
og lagre resultatet i variabelentotal_price
. - Identifiser antall manglende verdier i hver kolonne og lagre resultatet i variabelen
null_count
.
Løsning
99
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import pandas as pd
cars_data = {'model': [None, 'audi A6', 'audi A4', None,'audi A1'],
'year': [2017, 2016, 2017, None, 2016],
'fueltype': [None, 'diesel', 'diesel', 'petrol', 'petrol'],
'price': [12500, 16500, 16800, 17300, 16500]}
audi_cars = pd.DataFrame(cars_data)
# Write your code below
number_of_cells = audi_cars.count()
total_price = audi_cars['price'].sum()
null_count = audi_cars.isna().sum()
# Testing the result
print('Missing values:')
print(null_count)
print('Number of non-null cells:')
print(number_of_cells)
print(f'Total price: {total_price}')
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 14
99
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import pandas as pd
cars_data = {'model': [None, 'audi A6', 'audi A4', None,'audi A1'],
'year': [2017, 2016, 2017, None, 2016],
'fueltype': [None, 'diesel', 'diesel', 'petrol', 'petrol'],
'price': [12500, 16500, 16800, 17300, 16500]}
audi_cars = pd.DataFrame(cars_data)
# Write your code below
number_of_cells = ___
total_price = ___
null_count = ___
# Testing the result
print('Missing values:')
print(null_count)
print('Number of non-null cells:')
print(number_of_cells)
print(f'Total price: {total_price}')
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår