Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Encontrando os Menores Valores de uma Coluna | Extração de Dados
Técnicas Avançadas em Pandas

bookEncontrando os Menores Valores de uma Coluna

Vamos aprender outra função crucial, que retorna os maiores ou menores valores. Você já sabe que podemos ordenar valores e então extrair um número específico de linhas. Como era de se esperar, o pandas pode fazer isso utilizando apenas uma linha de código. Veja o exemplo de como recuperar os quinze carros mais antigos:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Se desejar ordenar por uma coluna e depois por outra, basta colocar uma lista com os nomes das colunas na ordem desejada. Veja o exemplo em que ordenamos primeiro por 'Year' e depois por 'Engine_volume'. Este código irá extrair primeiro os 5 carros mais antigos e, caso os anos coincidam, o carro com o menor valor na coluna 'Engine_volume' terá prioridade:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Tente comparar os dois exemplos abaixo. Agora vamos avançar um pouco mais na função. Vamos retornar nossos exemplos com os valores da coluna 'Year'. Em nossa coluna, os valores de 'Year' podem se repetir, então, se quisermos exibir os dez carros mais antigos com a sintaxe anterior, nossa função irá considerar apenas dez valores. Não importa se o 11º ou 12º valor é igual ao 10º. Podemos adicionar o argumento keep = 'all' ao método .nsmallest() para evitar esses casos. Observe o exemplo e tente executá-lo para ver a diferença:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Tarefa

Swipe to start coding

Finalmente, é hora de praticar! Aqui, siga este algoritmo:

  1. Recupere dados sobre carros onde os valores da coluna 'Year' sejam maiores que 2010.
  2. Extraia os 15 carros mais baratos (os 15 menores valores da coluna 'Price'). Inclua todos os valores duplicados da coluna 'Price'.
  3. Exiba todos os valores do conjunto de dados data_cheapest.

Solução

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 5
single

single

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

close

Awesome!

Completion rate improved to 3.03

bookEncontrando os Menores Valores de uma Coluna

Deslize para mostrar o menu

Vamos aprender outra função crucial, que retorna os maiores ou menores valores. Você já sabe que podemos ordenar valores e então extrair um número específico de linhas. Como era de se esperar, o pandas pode fazer isso utilizando apenas uma linha de código. Veja o exemplo de como recuperar os quinze carros mais antigos:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Se desejar ordenar por uma coluna e depois por outra, basta colocar uma lista com os nomes das colunas na ordem desejada. Veja o exemplo em que ordenamos primeiro por 'Year' e depois por 'Engine_volume'. Este código irá extrair primeiro os 5 carros mais antigos e, caso os anos coincidam, o carro com o menor valor na coluna 'Engine_volume' terá prioridade:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Tente comparar os dois exemplos abaixo. Agora vamos avançar um pouco mais na função. Vamos retornar nossos exemplos com os valores da coluna 'Year'. Em nossa coluna, os valores de 'Year' podem se repetir, então, se quisermos exibir os dez carros mais antigos com a sintaxe anterior, nossa função irá considerar apenas dez valores. Não importa se o 11º ou 12º valor é igual ao 10º. Podemos adicionar o argumento keep = 'all' ao método .nsmallest() para evitar esses casos. Observe o exemplo e tente executá-lo para ver a diferença:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Tarefa

Swipe to start coding

Finalmente, é hora de praticar! Aqui, siga este algoritmo:

  1. Recupere dados sobre carros onde os valores da coluna 'Year' sejam maiores que 2010.
  2. Extraia os 15 carros mais baratos (os 15 menores valores da coluna 'Price'). Inclua todos os valores duplicados da coluna 'Price'.
  3. Exiba todos os valores do conjunto de dados data_cheapest.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 3. Capítulo 5
single

single

some-alt