Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Concepts De Scikit-Learn | Prétraitement des Données avec Scikit-learn
Introduction au ML Avec Scikit-Learn

bookConcepts De Scikit-Learn

La bibliothèque scikit-learn (importée sous le nom de sklearn) propose diverses fonctions et classes pour le prétraitement des données et la modélisation. Les principaux objets de sklearn sont estimateur, transformateur, prédicteur et modèle.

Estimateur

Chaque classe de sklearn possédant la méthode .fit() est considérée comme un estimateur. La méthode .fit() permet à un objet d'apprendre à partir des données.

En d'autres termes, la méthode .fit() sert à entraîner un objet. Elle prend en paramètres X et y (y est optionnel pour les tâches d'apprentissage non supervisé).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Il n'est pas très utile qu'un objet apprenne uniquement à partir des données sans produire de résultat. Plus pratiques sont les deux types d'objets qui héritent de l'estimateur : le transformateur et le prédicteur.

Transformateur

Un transformateur possède la méthode .fit() ainsi que la méthode .transform() qui permet de transformer les données d'une certaine manière.

En général, les transformateurs doivent apprendre quelque chose à partir des données avant de pouvoir effectuer une transformation, il est donc nécessaire d'appliquer .fit() puis .transform(). Pour éviter cela, les transformateurs disposent également de la méthode .fit_transform().
.fit_transform() produit le même résultat qu'appliquer .fit() et .transform() séquentiellement, mais peut parfois être plus rapide ; il est donc préférable par rapport à .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Remarque

Les transformateurs sont généralement utilisés pour transformer le tableau X. Cependant, comme nous le verrons dans l'exemple de LabelEncoder, certains transformateurs sont conçus pour le tableau y.

Les valeurs nan affichées dans l'ensemble d'entraînement sur l'image indiquent des données manquantes en Python.

Prédicteur

Un prédicteur est un estimateur (possède la méthode .fit()) qui dispose également de la méthode .predict(). La méthode .predict() est utilisée pour effectuer des prédictions.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Modèle

Un modèle est un type de prédicteur qui inclut également la méthode .score(). Cette méthode calcule un score (métrique) pour mesurer la performance du prédicteur.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Comme mentionné dans le chapitre précédent, l'exactitude est une métrique représentant le pourcentage de prédictions correctes.

L'étape de prétraitement implique l'utilisation de transformateurs, tandis que nous travaillons avec des prédicteurs (plus précisément avec des modèles) lors de l'étape de modélisation.

question mark

Sélectionnez toutes les affirmations correctes.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 1

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 3.13

bookConcepts De Scikit-Learn

Glissez pour afficher le menu

La bibliothèque scikit-learn (importée sous le nom de sklearn) propose diverses fonctions et classes pour le prétraitement des données et la modélisation. Les principaux objets de sklearn sont estimateur, transformateur, prédicteur et modèle.

Estimateur

Chaque classe de sklearn possédant la méthode .fit() est considérée comme un estimateur. La méthode .fit() permet à un objet d'apprendre à partir des données.

En d'autres termes, la méthode .fit() sert à entraîner un objet. Elle prend en paramètres X et y (y est optionnel pour les tâches d'apprentissage non supervisé).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Il n'est pas très utile qu'un objet apprenne uniquement à partir des données sans produire de résultat. Plus pratiques sont les deux types d'objets qui héritent de l'estimateur : le transformateur et le prédicteur.

Transformateur

Un transformateur possède la méthode .fit() ainsi que la méthode .transform() qui permet de transformer les données d'une certaine manière.

En général, les transformateurs doivent apprendre quelque chose à partir des données avant de pouvoir effectuer une transformation, il est donc nécessaire d'appliquer .fit() puis .transform(). Pour éviter cela, les transformateurs disposent également de la méthode .fit_transform().
.fit_transform() produit le même résultat qu'appliquer .fit() et .transform() séquentiellement, mais peut parfois être plus rapide ; il est donc préférable par rapport à .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Remarque

Les transformateurs sont généralement utilisés pour transformer le tableau X. Cependant, comme nous le verrons dans l'exemple de LabelEncoder, certains transformateurs sont conçus pour le tableau y.

Les valeurs nan affichées dans l'ensemble d'entraînement sur l'image indiquent des données manquantes en Python.

Prédicteur

Un prédicteur est un estimateur (possède la méthode .fit()) qui dispose également de la méthode .predict(). La méthode .predict() est utilisée pour effectuer des prédictions.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Modèle

Un modèle est un type de prédicteur qui inclut également la méthode .score(). Cette méthode calcule un score (métrique) pour mesurer la performance du prédicteur.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Comme mentionné dans le chapitre précédent, l'exactitude est une métrique représentant le pourcentage de prédictions correctes.

L'étape de prétraitement implique l'utilisation de transformateurs, tandis que nous travaillons avec des prédicteurs (plus précisément avec des modèles) lors de l'étape de modélisation.

question mark

Sélectionnez toutes les affirmations correctes.

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 1
some-alt