Sveip for å vise menyen

Når du utvikler maskinlæringsløsninger, gjentar du ofte de samme trinnene: dataprosessering, feature engineering, modelltrening og evaluering. Å skrive disse trinnene separat kan føre til duplisering av kode og gjøre det vanskelig å reprodusere resultater. scikit-learn tilbyr klassen Pipeline, som lar deg kjede sammen prosesserings- og modelleringstrinn i én samlet arbeidsflyt. Denne tilnærmingen gjør koden din ryddigere, mer vedlikeholdbar og enklere å reprodusere.

Definisjon

En pipeline standardiserer ML-arbeidsflyten og reduserer kode duplisering.


              12345678910111213141516171819202122232425262728
            
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline

# Load sample data
iris = load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)
y = iris.target

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# Create a pipeline with preprocessing and modeling steps
pipeline = Pipeline([
    ("scaler", StandardScaler()),          # Step 1: Standardize features
    ("classifier", LogisticRegression())   # Step 2: Train classifier
])

# Fit the pipeline on training data
pipeline.fit(X_train, y_train)

# Predict on test data
predictions = pipeline.predict(X_test)

print("Pipeline accuracy:", pipeline.score(X_test, y_test))

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10

Spør AI

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Bygge Rørledninger med scikit-learn

Definisjon

En pipeline standardiserer ML-arbeidsflyten og reduserer kode duplisering.


              12345678910111213141516171819202122232425262728
            
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline

# Load sample data
iris = load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)
y = iris.target

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# Create a pipeline with preprocessing and modeling steps
pipeline = Pipeline([
    ("scaler", StandardScaler()),          # Step 1: Standardize features
    ("classifier", LogisticRegression())   # Step 2: Train classifier
])

# Fit the pipeline on training data
pipeline.fit(X_train, y_train)

# Predict on test data
predictions = pipeline.predict(X_test)

print("Pipeline accuracy:", pipeline.score(X_test, y_test))

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 10