single
Encontrando os Menores Valores de uma Coluna
Deslize para mostrar o menu
Você aprenderá outra função crucial, que retorna os maiores ou menores valores. Você já sabe que podemos ordenar valores e então extrair um número específico de linhas. Não surpreendentemente, o pandas pode fazer isso usando apenas uma linha de código. Veja o exemplo de como recuperar os quinze carros mais antigos:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
Se você quiser ordenar por uma coluna e depois por outra, basta colocar uma lista com os nomes das colunas na ordem desejada. Veja o exemplo onde ordenamos primeiro por 'Year' e depois por 'Engine_volume'. Este código irá extrair primeiro os 5 carros mais antigos e, caso os anos coincidam, o carro com o menor valor na coluna 'Engine_volume' terá prioridade:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
Tente comparar os dois exemplos abaixo. Agora vamos avançar um pouco mais na função. Vamos retornar nossos exemplos com os valores da coluna 'Year'. Em nossa coluna, os valores de 'Year' podem se repetir, então, se quisermos exibir os dez carros mais antigos com a sintaxe anterior, nossa função irá considerar apenas dez valores. Não importa se o 11º ou 12º valor é igual ao 10º. Podemos adicionar o argumento keep = 'all' ao método .nsmallest() para evitar esses casos. Observe o exemplo e tente executá-lo para ver a diferença:
1234567891011import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
Deslize para começar a programar
Aqui, siga este algoritmo:
- Recupere dados sobre carros onde os valores da coluna
'Year'sejam maiores que2010. - Extraia os
15carros mais baratos (os15menores valores da coluna'Price'). Inclua todos os valores duplicados da coluna'Price'. - Exiba todos os valores do conjunto de dados
data_cheapest.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo