Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Vad är en pipeline | Pipelines
Introduktion till maskininlärning med Python

Vad är en pipeline

Svep för att visa menyn

I föregående avsnitt genomfördes tre förbehandlingssteg: imputering, kodning och skalning.

PenguinsTableChange

Förbehandlingsstegen tillämpades ett i taget, där specifika kolumner transformerades och slogs samman tillbaka till X-arrayen. Detta tillvägagångssätt kan vara omständligt, särskilt med OneHotEncoder, som förändrar antalet kolumner.

En annan nackdel är att all ny data som används för prediktion måste genomgå samma sekvens av transformationer, vilket kräver att hela processen upprepas.

Pipeline-klassen i Scikit-learn förenklar detta genom att kombinera alla transformationer i ett enda arbetsflöde, vilket gör det enklare att tillämpa förbehandling konsekvent på både träningsdata och nya instanser.

PipelineExempel

En Pipeline fungerar som en behållare för en sekvens av transformatorer och slutligen en estimator. När du anropar metoden .fit_transform() på en Pipeline tillämpar den sekventiellt metoden .fit_transform() för varje transformator på data.

# Create a pipeline with three steps: imputation, one-hot encoding, and scaling
pipeline = Pipeline([
    ('imputer', SimpleImputer(strategy='most_frequent')),  # Step 1: Impute missing values
    ('encoder', OneHotEncoder()),                         # Step 2: Convert categorical data
    ('scaler', StandardScaler())                          # Step 3: Scale the data
])

# Fit and transform the data using the pipeline
X_transformed = pipeline.fit_transform(X)

Detta strömlinjeformade tillvägagångssätt innebär att du endast behöver anropa .fit_transform() en gång på träningsuppsättningen och därefter använda metoden .transform() för att bearbeta nya instanser.

question mark

Vad är den främsta fördelen med att använda en Pipeline i scikit-learn för datapreprocessering och modellträning?

Vänligen välj det korrekta svaret

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 1

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 3. Kapitel 1
some-alt