Encontrando os Menores Valores de uma Coluna
Vamos aprender outra função crucial, que retorna os maiores ou menores valores. Você já sabe que podemos ordenar valores e então extrair um número específico de linhas. Como era de se esperar, o pandas pode fazer isso utilizando apenas uma linha de código. Veja o exemplo de como recuperar os quinze carros mais antigos:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Se desejar ordenar por uma coluna e depois por outra, basta colocar uma lista com os nomes das colunas na ordem desejada. Veja o exemplo em que ordenamos primeiro por 'Year'
e depois por 'Engine_volume'
. Este código irá extrair primeiro os 5
carros mais antigos e, caso os anos coincidam, o carro com o menor valor na coluna 'Engine_volume'
terá prioridade:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Tente comparar os dois exemplos abaixo. Agora vamos avançar um pouco mais na função. Vamos retornar nossos exemplos com os valores da coluna 'Year'
. Em nossa coluna, os valores de 'Year'
podem se repetir, então, se quisermos exibir os dez carros mais antigos com a sintaxe anterior, nossa função irá considerar apenas dez valores. Não importa se o 11º ou 12º valor é igual ao 10º. Podemos adicionar o argumento keep = 'all'
ao método .nsmallest()
para evitar esses casos. Observe o exemplo e tente executá-lo para ver a diferença:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Finalmente, é hora de praticar! Aqui, siga este algoritmo:
- Recupere dados sobre carros onde os valores da coluna
'Year'
sejam maiores que2010
. - Extraia os
15
carros mais baratos (os15
menores valores da coluna'Price'
). Inclua todos os valores duplicados da coluna'Price'
. - Exiba todos os valores do conjunto de dados
data_cheapest
.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.03
Encontrando os Menores Valores de uma Coluna
Deslize para mostrar o menu
Vamos aprender outra função crucial, que retorna os maiores ou menores valores. Você já sabe que podemos ordenar valores e então extrair um número específico de linhas. Como era de se esperar, o pandas pode fazer isso utilizando apenas uma linha de código. Veja o exemplo de como recuperar os quinze carros mais antigos:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Se desejar ordenar por uma coluna e depois por outra, basta colocar uma lista com os nomes das colunas na ordem desejada. Veja o exemplo em que ordenamos primeiro por 'Year'
e depois por 'Engine_volume'
. Este código irá extrair primeiro os 5
carros mais antigos e, caso os anos coincidam, o carro com o menor valor na coluna 'Engine_volume'
terá prioridade:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Tente comparar os dois exemplos abaixo. Agora vamos avançar um pouco mais na função. Vamos retornar nossos exemplos com os valores da coluna 'Year'
. Em nossa coluna, os valores de 'Year'
podem se repetir, então, se quisermos exibir os dez carros mais antigos com a sintaxe anterior, nossa função irá considerar apenas dez valores. Não importa se o 11º ou 12º valor é igual ao 10º. Podemos adicionar o argumento keep = 'all'
ao método .nsmallest()
para evitar esses casos. Observe o exemplo e tente executá-lo para ver a diferença:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Swipe to start coding
Finalmente, é hora de praticar! Aqui, siga este algoritmo:
- Recupere dados sobre carros onde os valores da coluna
'Year'
sejam maiores que2010
. - Extraia os
15
carros mais baratos (os15
menores valores da coluna'Price'
). Inclua todos os valores duplicados da coluna'Price'
. - Exiba todos os valores do conjunto de dados
data_cheapest
.
Solução
Obrigado pelo seu feedback!
single