Concepts De Scikit-Learn
La bibliothèque scikit-learn (importée sous le nom de sklearn
) propose diverses fonctions et classes pour le prétraitement des données et la modélisation. Les principaux objets de sklearn
sont estimateur, transformateur, prédicteur et modèle.
Estimateur
Chaque classe de sklearn
possédant la méthode .fit()
est considérée comme un estimateur. La méthode .fit()
permet à un objet d'apprendre à partir des données.
En d'autres termes, la méthode .fit()
sert à entraîner un objet. Elle prend en paramètres X
et y
(y
est optionnel pour les tâches d'apprentissage non supervisé).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Il n'est pas très utile qu'un objet apprenne uniquement à partir des données sans produire de résultat. Plus pratiques sont les deux types d'objets qui héritent de l'estimateur : le transformateur et le prédicteur.
Transformateur
Un transformateur possède la méthode .fit()
ainsi que la méthode .transform()
qui permet de transformer les données d'une certaine manière.
En général, les transformateurs doivent apprendre quelque chose à partir des données avant de pouvoir effectuer une transformation, il est donc nécessaire d'appliquer .fit()
puis .transform()
. Pour éviter cela, les transformateurs disposent également de la méthode .fit_transform()
.
.fit_transform()
produit le même résultat qu'appliquer .fit()
et .transform()
séquentiellement, mais peut parfois être plus rapide ; il est donc préférable par rapport à .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Les transformateurs sont généralement utilisés pour transformer le tableau X
. Cependant, comme nous le verrons dans l'exemple de LabelEncoder
, certains transformateurs sont conçus pour le tableau y
.
Les valeurs nan
affichées dans l'ensemble d'entraînement sur l'image indiquent des données manquantes en Python.
Prédicteur
Un prédicteur est un estimateur (possède la méthode .fit()
) qui dispose également de la méthode .predict()
. La méthode .predict()
est utilisée pour effectuer des prédictions.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modèle
Un modèle est un type de prédicteur qui inclut également la méthode .score()
. Cette méthode calcule un score (métrique) pour mesurer la performance du prédicteur.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Comme mentionné dans le chapitre précédent, l'exactitude est une métrique représentant le pourcentage de prédictions correctes.
L'étape de prétraitement implique l'utilisation de transformateurs, tandis que nous travaillons avec des prédicteurs (plus précisément avec des modèles) lors de l'étape de modélisation.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.13
Concepts De Scikit-Learn
Glissez pour afficher le menu
La bibliothèque scikit-learn (importée sous le nom de sklearn
) propose diverses fonctions et classes pour le prétraitement des données et la modélisation. Les principaux objets de sklearn
sont estimateur, transformateur, prédicteur et modèle.
Estimateur
Chaque classe de sklearn
possédant la méthode .fit()
est considérée comme un estimateur. La méthode .fit()
permet à un objet d'apprendre à partir des données.
En d'autres termes, la méthode .fit()
sert à entraîner un objet. Elle prend en paramètres X
et y
(y
est optionnel pour les tâches d'apprentissage non supervisé).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Il n'est pas très utile qu'un objet apprenne uniquement à partir des données sans produire de résultat. Plus pratiques sont les deux types d'objets qui héritent de l'estimateur : le transformateur et le prédicteur.
Transformateur
Un transformateur possède la méthode .fit()
ainsi que la méthode .transform()
qui permet de transformer les données d'une certaine manière.
En général, les transformateurs doivent apprendre quelque chose à partir des données avant de pouvoir effectuer une transformation, il est donc nécessaire d'appliquer .fit()
puis .transform()
. Pour éviter cela, les transformateurs disposent également de la méthode .fit_transform()
.
.fit_transform()
produit le même résultat qu'appliquer .fit()
et .transform()
séquentiellement, mais peut parfois être plus rapide ; il est donc préférable par rapport à .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Les transformateurs sont généralement utilisés pour transformer le tableau X
. Cependant, comme nous le verrons dans l'exemple de LabelEncoder
, certains transformateurs sont conçus pour le tableau y
.
Les valeurs nan
affichées dans l'ensemble d'entraînement sur l'image indiquent des données manquantes en Python.
Prédicteur
Un prédicteur est un estimateur (possède la méthode .fit()
) qui dispose également de la méthode .predict()
. La méthode .predict()
est utilisée pour effectuer des prédictions.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modèle
Un modèle est un type de prédicteur qui inclut également la méthode .score()
. Cette méthode calcule un score (métrique) pour mesurer la performance du prédicteur.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Comme mentionné dans le chapitre précédent, l'exactitude est une métrique représentant le pourcentage de prédictions correctes.
L'étape de prétraitement implique l'utilisation de transformateurs, tandis que nous travaillons avec des prédicteurs (plus précisément avec des modèles) lors de l'étape de modélisation.
Merci pour vos commentaires !