Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Combiner Vos Connaissances | Extraction de Données
Techniques Avancées dans Pandas

bookCombiner Vos Connaissances

Si vous vous souvenez, il y a plusieurs chapitres, des informations vous ont été fournies sur la manière d'écrire plusieurs conditions simultanément. Avec l'instruction .isin(), vous pouvez appliquer les mêmes règles. Par exemple, un exemple du chapitre précédent pourrait ressembler à ceci :

# The initial example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
data_extracted = data.loc[data['Manufacturer'].isin(models)]
print(data_extracted.head())

# The modified example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
condition = data['Manufacturer'].isin(models)
data_extracted = data.loc[condition]
print(data_extracted.head())

Le résultat dans ces deux cas sera identique.

question-icon

L'objectif ici est de faire en sorte que les données satisfassent trois conditions : les catégories des voitures sont 'Sedan', 'Jeep', 'Coupe', ET la voiture possède un intérieur en cuir ('Leather_interior' == Yes), ET les types de boîte de vitesses sont 'Variator' ou 'Automatic'.

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)

categories = ['Sedan', 'Jeep', 'Coupe']
gear_box = ['Variator', 'Automatic']

condition_1 = data['Category'].

(categories)
condition_2 = data['Leather_interior']
'Yes'
condition_3 = data['Gear_box_type'].


data_extracted = data.loc[condition_1
condition_2condition_3]

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Suggested prompts:

Can you explain what the `.isin()` function does in this context?

What is the difference between using the condition directly in `.loc[]` and assigning it to a variable first?

Can you show more examples of using `.isin()` with different columns?

Awesome!

Completion rate improved to 3.03

bookCombiner Vos Connaissances

Glissez pour afficher le menu

Si vous vous souvenez, il y a plusieurs chapitres, des informations vous ont été fournies sur la manière d'écrire plusieurs conditions simultanément. Avec l'instruction .isin(), vous pouvez appliquer les mêmes règles. Par exemple, un exemple du chapitre précédent pourrait ressembler à ceci :

# The initial example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
data_extracted = data.loc[data['Manufacturer'].isin(models)]
print(data_extracted.head())

# The modified example
import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)
models = ['HONDA', 'FORD', 'MERCEDES-BENZ', 'HYUNDAI']
condition = data['Manufacturer'].isin(models)
data_extracted = data.loc[condition]
print(data_extracted.head())

Le résultat dans ces deux cas sera identique.

question-icon

L'objectif ici est de faire en sorte que les données satisfassent trois conditions : les catégories des voitures sont 'Sedan', 'Jeep', 'Coupe', ET la voiture possède un intérieur en cuir ('Leather_interior' == Yes), ET les types de boîte de vitesses sont 'Variator' ou 'Automatic'.

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/cars.csv', index_col = 0)

categories = ['Sedan', 'Jeep', 'Coupe']
gear_box = ['Variator', 'Automatic']

condition_1 = data['Category'].

(categories)
condition_2 = data['Leather_interior']
'Yes'
condition_3 = data['Gear_box_type'].


data_extracted = data.loc[condition_1
condition_2condition_3]

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 2
some-alt