Trovare i Valori Più Piccoli di una Colonna
Imparerai un'altra funzione fondamentale, che restituisce i valori più piccoli o più grandi. Sai già che possiamo ordinare i valori e poi estrarre un numero specifico di righe. Non sorprende che pandas possa farlo utilizzando una sola riga di codice. Osserva l'esempio su come recuperare le quindici auto più vecchie:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Se desideri ordinare prima per una colonna e poi per un'altra, inserisci semplicemente un elenco con i nomi delle colonne nell'ordine necessario. Osserva l'esempio in cui ordineremo prima per 'Year' e poi per 'Engine_volume'. Questo codice estrarrà prima le 5 auto più vecchie e, se gli anni coincidono, avrà la precedenza l'auto con il valore minore nella colonna 'Engine_volume':
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Confrontare i due esempi riportati di seguito. Ora approfondiremo ulteriormente la funzione. Restituiamo i nostri esempi utilizzando i valori della colonna 'Year'. Nella nostra colonna, i valori 'Year' possono essere ripetuti, quindi se desideriamo ottenere le dieci auto più vecchie con la sintassi precedente, la funzione selezionerà semplicemente dieci valori, senza considerare se l'undicesimo o il dodicesimo valore siano uguali al decimo. Possiamo inserire l'argomento keep = 'all' nel metodo .nsmallest() per evitare tali situazioni. Osservare l'esempio ed eseguirlo per vedere la differenza:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Qui, è necessario seguire questo algoritmo:
- Recuperare i dati sulle auto in cui i valori della colonna
'Year'sono maggiori di2010. - Estrarre le
15auto più economiche (i15valori più bassi della colonna'Price'). Includere tutti i valori duplicati della colonna'Price'. - Visualizzare tutti i valori del set di dati
data_cheapest.
Soluzione
Grazie per i tuoi commenti!
single
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain what the `keep='all'` argument does in more detail?
How does `.nsmallest()` differ from sorting and slicing the DataFrame?
Can I use `.nlargest()` in a similar way to get the newest cars?
Awesome!
Completion rate improved to 3.03
Trovare i Valori Più Piccoli di una Colonna
Scorri per mostrare il menu
Imparerai un'altra funzione fondamentale, che restituisce i valori più piccoli o più grandi. Sai già che possiamo ordinare i valori e poi estrarre un numero specifico di righe. Non sorprende che pandas possa farlo utilizzando una sola riga di codice. Osserva l'esempio su come recuperare le quindici auto più vecchie:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Se desideri ordinare prima per una colonna e poi per un'altra, inserisci semplicemente un elenco con i nomi delle colonne nell'ordine necessario. Osserva l'esempio in cui ordineremo prima per 'Year' e poi per 'Engine_volume'. Questo codice estrarrà prima le 5 auto più vecchie e, se gli anni coincidono, avrà la precedenza l'auto con il valore minore nella colonna 'Engine_volume':
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Confrontare i due esempi riportati di seguito. Ora approfondiremo ulteriormente la funzione. Restituiamo i nostri esempi utilizzando i valori della colonna 'Year'. Nella nostra colonna, i valori 'Year' possono essere ripetuti, quindi se desideriamo ottenere le dieci auto più vecchie con la sintassi precedente, la funzione selezionerà semplicemente dieci valori, senza considerare se l'undicesimo o il dodicesimo valore siano uguali al decimo. Possiamo inserire l'argomento keep = 'all' nel metodo .nsmallest() per evitare tali situazioni. Osservare l'esempio ed eseguirlo per vedere la differenza:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Qui, è necessario seguire questo algoritmo:
- Recuperare i dati sulle auto in cui i valori della colonna
'Year'sono maggiori di2010. - Estrarre le
15auto più economiche (i15valori più bassi della colonna'Price'). Includere tutti i valori duplicati della colonna'Price'. - Visualizzare tutti i valori del set di dati
data_cheapest.
Soluzione
Grazie per i tuoi commenti!
single