Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Che cos'è una pipeline | Pipeline
Introduzione al Machine Learning con Python

Che cos'è una pipeline

Scorri per mostrare il menu

Nella sezione precedente sono stati completati tre passaggi di pre-elaborazione: imputazione, codifica e normalizzazione.

PenguinsTableChange

I passaggi di pre-elaborazione sono stati applicati uno alla volta, trasformando colonne specifiche e reintegrandole nell'array X. Questo approccio può risultare complesso, soprattutto con OneHotEncoder, che modifica il numero di colonne.

Un altro svantaggio è che qualsiasi nuovo dato utilizzato per la previsione deve essere sottoposto alla stessa sequenza di trasformazioni, richiedendo la ripetizione dell'intero processo.

La classe Pipeline di Scikit-learn semplifica questo processo combinando tutte le trasformazioni in un unico flusso di lavoro, rendendo più semplice applicare la pre-elaborazione in modo coerente sia ai dati di addestramento che alle nuove istanze.

PipelineExample

Un Pipeline funge da contenitore per una sequenza di trasformatori e, infine, un stimatore. Quando si richiama il metodo .fit_transform() su un Pipeline, applica sequenzialmente il metodo .fit_transform() di ciascun trasformatore ai dati.

# Create a pipeline with three steps: imputation, one-hot encoding, and scaling
pipeline = Pipeline([
    ('imputer', SimpleImputer(strategy='most_frequent')),  # Step 1: Impute missing values
    ('encoder', OneHotEncoder()),                         # Step 2: Convert categorical data
    ('scaler', StandardScaler())                          # Step 3: Scale the data
])

# Fit and transform the data using the pipeline
X_transformed = pipeline.fit_transform(X)

Questo approccio semplificato significa che è necessario chiamare .fit_transform() una sola volta sul set di addestramento e successivamente utilizzare il metodo .transform() per elaborare nuove istanze.

question mark

Qual è il principale vantaggio dell'utilizzo di un Pipeline in scikit-learn per la pre-elaborazione dei dati e l'addestramento del modello?

Seleziona la risposta corretta

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 1

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Sezione 3. Capitolo 1
some-alt