Concepts de Scikit-learn
La bibliothèque scikit-learn (importée sous le nom sklearn) propose diverses fonctions et classes pour le prétraitement des données et la modélisation. Les principaux objets de sklearn sont estimateur, transformateur, prédicteur et modèle.
Estimateur
Chaque classe de sklearn possédant la méthode .fit() est considérée comme un estimateur. La méthode .fit() permet à un objet d'apprendre à partir des données.
En d'autres termes, la méthode .fit() sert à entraîner un objet. Elle prend en paramètres X et y (y est optionnel pour les tâches d'apprentissage non supervisé).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Il n'est pas très utile qu'un objet apprenne simplement à partir des données sans produire de résultat. Deux types d'objets héritant de l'estimateur sont plus pratiques : le transformateur et le prédicteur.
Transformateur
Un transformateur possède la méthode .fit() et la méthode .transform() qui permet de transformer les données d'une certaine manière.
En général, les transformateurs doivent apprendre quelque chose à partir des données avant de les transformer, il est donc nécessaire d'appliquer .fit() puis .transform(). Pour éviter cela, les transformateurs disposent également de la méthode .fit_transform().
.fit_transform() donne le même résultat qu'appliquer .fit() puis .transform() séquentiellement, mais est parfois plus rapide, il est donc préférable de l'utiliser plutôt que .fit().transform().
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Les transformateurs sont généralement utilisés pour transformer le tableau X. Cependant, comme nous le verrons dans l'exemple de LabelEncoder, certains transformateurs sont conçus pour le tableau y.
Les valeurs nan affichées dans l'ensemble d'entraînement sur l'image indiquent des données manquantes en Python.
Prédicteur
Un prédicteur est un estimateur (possède la méthode .fit()) qui dispose également de la méthode .predict(). La méthode .predict() est utilisée pour effectuer des prédictions.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modèle
Un modèle est un type de prédicteur qui inclut également la méthode .score(). Cette méthode calcule un score (métrique) pour mesurer la performance du prédicteur.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Comme mentionné dans le chapitre précédent, l'exactitude est une métrique représentant le pourcentage de prédictions correctes.
L'étape de prétraitement implique l'utilisation de transformateurs, tandis que nous travaillons avec des prédicteurs (plus précisément avec des modèles) lors de l'étape de modélisation.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain the difference between a transformer and a predictor?
What are some common examples of transformers and predictors in scikit-learn?
How do I choose which scikit-learn object to use for my task?
Awesome!
Completion rate improved to 3.13
Concepts de Scikit-learn
Glissez pour afficher le menu
La bibliothèque scikit-learn (importée sous le nom sklearn) propose diverses fonctions et classes pour le prétraitement des données et la modélisation. Les principaux objets de sklearn sont estimateur, transformateur, prédicteur et modèle.
Estimateur
Chaque classe de sklearn possédant la méthode .fit() est considérée comme un estimateur. La méthode .fit() permet à un objet d'apprendre à partir des données.
En d'autres termes, la méthode .fit() sert à entraîner un objet. Elle prend en paramètres X et y (y est optionnel pour les tâches d'apprentissage non supervisé).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Il n'est pas très utile qu'un objet apprenne simplement à partir des données sans produire de résultat. Deux types d'objets héritant de l'estimateur sont plus pratiques : le transformateur et le prédicteur.
Transformateur
Un transformateur possède la méthode .fit() et la méthode .transform() qui permet de transformer les données d'une certaine manière.
En général, les transformateurs doivent apprendre quelque chose à partir des données avant de les transformer, il est donc nécessaire d'appliquer .fit() puis .transform(). Pour éviter cela, les transformateurs disposent également de la méthode .fit_transform().
.fit_transform() donne le même résultat qu'appliquer .fit() puis .transform() séquentiellement, mais est parfois plus rapide, il est donc préférable de l'utiliser plutôt que .fit().transform().
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Les transformateurs sont généralement utilisés pour transformer le tableau X. Cependant, comme nous le verrons dans l'exemple de LabelEncoder, certains transformateurs sont conçus pour le tableau y.
Les valeurs nan affichées dans l'ensemble d'entraînement sur l'image indiquent des données manquantes en Python.
Prédicteur
Un prédicteur est un estimateur (possède la méthode .fit()) qui dispose également de la méthode .predict(). La méthode .predict() est utilisée pour effectuer des prédictions.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Modèle
Un modèle est un type de prédicteur qui inclut également la méthode .score(). Cette méthode calcule un score (métrique) pour mesurer la performance du prédicteur.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Comme mentionné dans le chapitre précédent, l'exactitude est une métrique représentant le pourcentage de prédictions correctes.
L'étape de prétraitement implique l'utilisation de transformateurs, tandis que nous travaillons avec des prédicteurs (plus précisément avec des modèles) lors de l'étape de modélisation.
Merci pour vos commentaires !