Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Putkistojen Rakentaminen Scikit-learnilla | Osio
Mlopsin Perusteet

bookPutkistojen Rakentaminen Scikit-learnilla

Kun rakennat koneoppimisratkaisuja, toistat usein samoja vaiheita: datan esikäsittely, piirteiden muokkaus, mallin koulutus ja arviointi. Näiden vaiheiden kirjoittaminen erikseen voi johtaa koodin toistoon ja vaikeuttaa tulosten toistettavuutta. scikit-learn tarjoaa Pipeline-luokan, jonka avulla voit ketjuttaa esikäsittely- ja mallinnusvaiheet yhdeksi, virtaviivaiseksi työnkuluksi. Tämä lähestymistapa tekee koodistasi selkeämpää, helpommin ylläpidettävää ja helpommin toistettavaa.

Note
Määritelmä

Putki yhdenmukaistaa ML-työnkulun ja vähentää koodin toistoa.

12345678910111213141516171819202122232425262728
import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LogisticRegression from sklearn.pipeline import Pipeline # Load sample data iris = load_iris() X = pd.DataFrame(iris.data, columns=iris.feature_names) y = iris.target # Split data X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42) # Create a pipeline with preprocessing and modeling steps pipeline = Pipeline([ ("scaler", StandardScaler()), # Step 1: Standardize features ("classifier", LogisticRegression()) # Step 2: Train classifier ]) # Fit the pipeline on training data pipeline.fit(X_train, y_train) # Predict on test data predictions = pipeline.predict(X_test) print("Pipeline accuracy:", pipeline.score(X_test, y_test))
copy
question mark

Mikä on scikit-learnin Pipeline-luokan ensisijainen hyöty koneoppimisen työnkulkuja rakennettaessa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 10

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookPutkistojen Rakentaminen Scikit-learnilla

Pyyhkäise näyttääksesi valikon

Kun rakennat koneoppimisratkaisuja, toistat usein samoja vaiheita: datan esikäsittely, piirteiden muokkaus, mallin koulutus ja arviointi. Näiden vaiheiden kirjoittaminen erikseen voi johtaa koodin toistoon ja vaikeuttaa tulosten toistettavuutta. scikit-learn tarjoaa Pipeline-luokan, jonka avulla voit ketjuttaa esikäsittely- ja mallinnusvaiheet yhdeksi, virtaviivaiseksi työnkuluksi. Tämä lähestymistapa tekee koodistasi selkeämpää, helpommin ylläpidettävää ja helpommin toistettavaa.

Note
Määritelmä

Putki yhdenmukaistaa ML-työnkulun ja vähentää koodin toistoa.

12345678910111213141516171819202122232425262728
import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LogisticRegression from sklearn.pipeline import Pipeline # Load sample data iris = load_iris() X = pd.DataFrame(iris.data, columns=iris.feature_names) y = iris.target # Split data X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42) # Create a pipeline with preprocessing and modeling steps pipeline = Pipeline([ ("scaler", StandardScaler()), # Step 1: Standardize features ("classifier", LogisticRegression()) # Step 2: Train classifier ]) # Fit the pipeline on training data pipeline.fit(X_train, y_train) # Predict on test data predictions = pipeline.predict(X_test) print("Pipeline accuracy:", pipeline.score(X_test, y_test))
copy
question mark

Mikä on scikit-learnin Pipeline-luokan ensisijainen hyöty koneoppimisen työnkulkuja rakennettaessa?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 10
some-alt