Valores Únicos
Os dados frequentemente apresentam duplicatas em DataFrames. Por exemplo, no DataFrame countries
, a coluna 'continent'
possui entradas repetidas. Existe um método que recupera um array de valores distintos de uma coluna específica do DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Em seguida, aplicar o método unique()
às colunas 'continent'
e 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Para contar o número de valores distintos em uma coluna específica, utilize o método nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Você recebe um DataFrame
chamado audi_cars
.
- Identifique todos os valores distintos na coluna
'year'
e armazene o resultado na colunaunique_years
. - Identifique todos os valores distintos na coluna
'fueltype'
e armazene o resultado na variávelunique_fueltype
. - Determine o número de tipos de combustível únicos e armazene o resultado na variável
count_unique_fueltypes
.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
How does the nunique() method work?
Can I use nunique() on multiple columns at once?
What is the difference between unique() and nunique()?
Awesome!
Completion rate improved to 3.03
Valores Únicos
Deslize para mostrar o menu
Os dados frequentemente apresentam duplicatas em DataFrames. Por exemplo, no DataFrame countries
, a coluna 'continent'
possui entradas repetidas. Existe um método que recupera um array de valores distintos de uma coluna específica do DataFrame.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Em seguida, aplicar o método unique()
às colunas 'continent'
e 'country'
:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Para contar o número de valores distintos em uma coluna específica, utilize o método nunique()
:
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Você recebe um DataFrame
chamado audi_cars
.
- Identifique todos os valores distintos na coluna
'year'
e armazene o resultado na colunaunique_years
. - Identifique todos os valores distintos na coluna
'fueltype'
e armazene o resultado na variávelunique_fueltype
. - Determine o número de tipos de combustível únicos e armazene o resultado na variável
count_unique_fueltypes
.
Solução
Obrigado pelo seu feedback!
single