Pyyhkäise näyttääksesi valikon

Kun rakennat koneoppimisratkaisuja, toistat usein samoja vaiheita: datan esikäsittely, piirteiden muokkaus, mallin koulutus ja arviointi. Näiden vaiheiden kirjoittaminen erikseen voi johtaa koodin toistoon ja vaikeuttaa tulosten toistettavuutta. scikit-learn tarjoaa Pipeline-luokan, jonka avulla voit ketjuttaa esikäsittely- ja mallinnusvaiheet yhdeksi, virtaviivaiseksi työnkuluksi. Tämä lähestymistapa tekee koodistasi selkeämpää, helpommin ylläpidettävää ja helpommin toistettavaa.

Määritelmä

Putki yhdenmukaistaa ML-työnkulun ja vähentää koodin toistoa.


              12345678910111213141516171819202122232425262728
            
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline

# Load sample data
iris = load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)
y = iris.target

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# Create a pipeline with preprocessing and modeling steps
pipeline = Pipeline([
    ("scaler", StandardScaler()),          # Step 1: Standardize features
    ("classifier", LogisticRegression())   # Step 2: Train classifier
])

# Fit the pipeline on training data
pipeline.fit(X_train, y_train)

# Predict on test data
predictions = pipeline.predict(X_test)

print("Pipeline accuracy:", pipeline.score(X_test, y_test))

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 1. Luku 10

Kysy tekoälyä

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Putkistojen Rakentaminen Scikit-learnilla

Määritelmä

Putki yhdenmukaistaa ML-työnkulun ja vähentää koodin toistoa.


              12345678910111213141516171819202122232425262728
            
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline

# Load sample data
iris = load_iris()
X = pd.DataFrame(iris.data, columns=iris.feature_names)
y = iris.target

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

# Create a pipeline with preprocessing and modeling steps
pipeline = Pipeline([
    ("scaler", StandardScaler()),          # Step 1: Standardize features
    ("classifier", LogisticRegression())   # Step 2: Train classifier
])

# Fit the pipeline on training data
pipeline.fit(X_train, y_train)

# Predict on test data
predictions = pipeline.predict(X_test)

print("Pipeline accuracy:", pipeline.score(X_test, y_test))

Oliko kaikki selvää?

Kiitos palautteestasi!

Osio 1. Luku 10