セクション 3. 章 15
single
ユニーク値
メニューを表示するにはスワイプしてください
データフレーム内のデータはしばしば重複します。例えば、countriesデータフレームの'continent'列には同じ値が繰り返し登場します。特定のデータフレーム列から異なる値の配列を取得するメソッドがあります。
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
次に、unique()メソッドを'continent'列と'country'列に適用します。
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
すべてのユニークな値を取得するのではなく、列内にいくつの異なる値が存在するかだけを知りたい場合があります。そのような場合は、nunique() メソッドを使用できます。これは、列内のユニークなエントリの数を返します(値自体ではありません)。
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
タスク
スワイプしてコーディングを開始
DataFrameという名前のaudi_carsが与えられています。
このデータを調査し、Pandasのメソッドを使ってユニークな値を特定してください。
'year'列からすべての異なる値を取得し、変数unique_yearsに格納してください。'fueltype'列からすべての異なる値を取得し、変数unique_fueltypeに格納してください。'fueltype'メソッドを使って、.nunique()列に含まれるユニークな燃料タイプの数を求め、その結果を変数count_unique_fueltypesに格納してください。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 3. 章 15
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください