Valores Únicos
Los datos a menudo se duplican en los DataFrames. Por ejemplo, en el DataFrame countries, la columna 'continent' contiene entradas repetidas. Existe un método que recupera un arreglo de valores distintos de una columna específica del DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
A continuación, aplicar el método unique() a las columnas 'continent' y 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Para contar la cantidad de valores distintos en una columna específica, se puede utilizar el método nunique():
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Se proporciona un DataFrame llamado audi_cars.
- Identificar todos los valores distintos en la columna
'year'y almacenar el resultado en la columnaunique_years. - Identificar todos los valores distintos en la columna
'fueltype'y almacenar el resultado en la variableunique_fueltype. - Determinar la cantidad de tipos de combustible únicos y almacenar el resultado en la variable
count_unique_fueltypes.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
How does the nunique() method work?
Can I use nunique() on multiple columns at once?
What is the difference between unique() and nunique()?
Awesome!
Completion rate improved to 3.03
Valores Únicos
Desliza para mostrar el menú
Los datos a menudo se duplican en los DataFrames. Por ejemplo, en el DataFrame countries, la columna 'continent' contiene entradas repetidas. Existe un método que recupera un arreglo de valores distintos de una columna específica del DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
A continuación, aplicar el método unique() a las columnas 'continent' y 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Para contar la cantidad de valores distintos en una columna específica, se puede utilizar el método nunique():
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Se proporciona un DataFrame llamado audi_cars.
- Identificar todos los valores distintos en la columna
'year'y almacenar el resultado en la columnaunique_years. - Identificar todos los valores distintos en la columna
'fueltype'y almacenar el resultado en la variableunique_fueltype. - Determinar la cantidad de tipos de combustible únicos y almacenar el resultado en la variable
count_unique_fueltypes.
Solución
¡Gracias por tus comentarios!
single