Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Encontrar los Valores Más Pequeños de una Columna | Extracción de Datos
Técnicas Avanzadas en Pandas

bookEncontrar los Valores Más Pequeños de una Columna

Aprenderemos otra función crucial, que devuelve los valores más pequeños o más grandes. Ya sabes que podemos ordenar valores y luego extraer un número específico de filas. No es sorprendente que pandas pueda hacerlo utilizando solo una línea de código. Observa el ejemplo de cómo recuperar los quince autos más antiguos:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Si deseas ordenar por una columna y luego por otra, simplemente coloca una lista con los nombres de las columnas en el orden necesario. Observa el ejemplo donde primero ordenaremos por 'Year' y luego por 'Engine_volume'. Este código primero extraerá los 5 autos más antiguos, y luego, si los años coinciden, el auto con el menor valor en la columna 'Engine_volume' tendrá prioridad:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Intente comparar los dos ejemplos a continuación. Ahora avanzaremos un poco más con la función. Vamos a devolver nuestros ejemplos utilizando los valores de la columna 'Year'. En nuestra columna, los valores de 'Year' pueden repetirse, por lo que si queremos mostrar los diez autos más antiguos con la sintaxis anterior, nuestra función tomará solo diez valores. No considera si el valor 11 o 12 es igual al décimo. Podemos agregar el argumento keep = 'all' al método .nsmallest() para evitar estos casos. Observe el ejemplo y ejecútelo para ver la diferencia:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Tarea

Swipe to start coding

¡Finalmente, es momento de practicar! Aquí, se debe seguir el siguiente algoritmo:

  1. Recuperar los datos de los autos donde los valores de la columna 'Year' sean mayores que 2010.
  2. Extraer los 15 autos más económicos (los 15 valores más bajos de la columna 'Price'). Incluir todos los valores duplicados de la columna 'Price'.
  3. Mostrar todos los valores del conjunto de datos data_cheapest.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 5
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Suggested prompts:

Can you explain what the `nsmallest()` function does in pandas?

What does the `keep='all'` argument change in the output?

How can I use `nlargest()` instead of `nsmallest()` for the largest values?

close

Awesome!

Completion rate improved to 3.03

bookEncontrar los Valores Más Pequeños de una Columna

Desliza para mostrar el menú

Aprenderemos otra función crucial, que devuelve los valores más pequeños o más grandes. Ya sabes que podemos ordenar valores y luego extraer un número específico de filas. No es sorprendente que pandas pueda hacerlo utilizando solo una línea de código. Observa el ejemplo de cómo recuperar los quince autos más antiguos:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(15, 'Year') print(data_smallest.head(15))
copy

Si deseas ordenar por una columna y luego por otra, simplemente coloca una lista con los nombres de las columnas en el orden necesario. Observa el ejemplo donde primero ordenaremos por 'Year' y luego por 'Engine_volume'. Este código primero extraerá los 5 autos más antiguos, y luego, si los años coinciden, el auto con el menor valor en la columna 'Engine_volume' tendrá prioridad:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) data_smallest = data.nsmallest(5, ['Year', 'Engine_volume']) print(data_smallest.head())
copy

Intente comparar los dos ejemplos a continuación. Ahora avanzaremos un poco más con la función. Vamos a devolver nuestros ejemplos utilizando los valores de la columna 'Year'. En nuestra columna, los valores de 'Year' pueden repetirse, por lo que si queremos mostrar los diez autos más antiguos con la sintaxis anterior, nuestra función tomará solo diez valores. No considera si el valor 11 o 12 es igual al décimo. Podemos agregar el argumento keep = 'all' al método .nsmallest() para evitar estos casos. Observe el ejemplo y ejecútelo para ver la diferencia:

1234567891011
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case without using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year') print(data_smallest) data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0) # Case with using `keep = 'all'` argument data_smallest = data.nsmallest(6, 'Year', keep = 'all') print(data_smallest)
copy
Tarea

Swipe to start coding

¡Finalmente, es momento de practicar! Aquí, se debe seguir el siguiente algoritmo:

  1. Recuperar los datos de los autos donde los valores de la columna 'Year' sean mayores que 2010.
  2. Extraer los 15 autos más económicos (los 15 valores más bajos de la columna 'Price'). Incluir todos los valores duplicados de la columna 'Price'.
  3. Mostrar todos los valores del conjunto de datos data_cheapest.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 3. Capítulo 5
single

single

some-alt