Valores Únicos
Los datos suelen estar duplicados en los DataFrames. Por ejemplo, en el DataFrame countries, la columna 'continent' contiene entradas repetidas. Existe un método que recupera un arreglo de valores distintos de una columna específica del DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
A continuación, aplicar el método unique() a las columnas 'continent' y 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
A veces, en lugar de recuperar todos los valores únicos, solo se desea saber cuántos valores distintos existen en una columna. En estos casos, se puede utilizar el método nunique(). Este devuelve el conteo de entradas únicas en una columna, no los valores en sí.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Se te proporciona un DataFrame llamado audi_cars.
Tu objetivo es explorar sus datos e identificar valores únicos utilizando métodos de Pandas.
- Recuperar todos los valores distintos de la columna
'year'y almacenarlos en la variableunique_years. - Recuperar todos los valores distintos de la columna
'fueltype'y almacenarlos en la variableunique_fueltype. - Determinar el número de tipos de combustible únicos en la columna
'fueltype'utilizando el método.nunique()y guardar el resultado en la variablecount_unique_fueltypes.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
What does the output of the nunique() method look like?
Can I use nunique() on multiple columns at once?
What happens if there are missing values in the column?
Awesome!
Completion rate improved to 3.03
Valores Únicos
Desliza para mostrar el menú
Los datos suelen estar duplicados en los DataFrames. Por ejemplo, en el DataFrame countries, la columna 'continent' contiene entradas repetidas. Existe un método que recupera un arreglo de valores distintos de una columna específica del DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
A continuación, aplicar el método unique() a las columnas 'continent' y 'country':
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
A veces, en lugar de recuperar todos los valores únicos, solo se desea saber cuántos valores distintos existen en una columna. En estos casos, se puede utilizar el método nunique(). Este devuelve el conteo de entradas únicas en una columna, no los valores en sí.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Se te proporciona un DataFrame llamado audi_cars.
Tu objetivo es explorar sus datos e identificar valores únicos utilizando métodos de Pandas.
- Recuperar todos los valores distintos de la columna
'year'y almacenarlos en la variableunique_years. - Recuperar todos los valores distintos de la columna
'fueltype'y almacenarlos en la variableunique_fueltype. - Determinar el número de tipos de combustible únicos en la columna
'fueltype'utilizando el método.nunique()y guardar el resultado en la variablecount_unique_fueltypes.
Solución
¡Gracias por tus comentarios!
single