Bygge Rørledninger med scikit-learn
Når du utvikler maskinlæringsløsninger, gjentar du ofte de samme trinnene: dataprosessering, feature engineering, modelltrening og evaluering. Å skrive disse trinnene separat kan føre til duplisering av kode og gjøre det vanskelig å reprodusere resultater. scikit-learn tilbyr klassen Pipeline, som lar deg kjede sammen prosesserings- og modelleringstrinn i én samlet arbeidsflyt. Denne tilnærmingen gjør koden din ryddigere, mer vedlikeholdbar og enklere å reprodusere.
En pipeline standardiserer ML-arbeidsflyten og reduserer kode duplisering.
12345678910111213141516171819202122232425262728import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LogisticRegression from sklearn.pipeline import Pipeline # Load sample data iris = load_iris() X = pd.DataFrame(iris.data, columns=iris.feature_names) y = iris.target # Split data X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42) # Create a pipeline with preprocessing and modeling steps pipeline = Pipeline([ ("scaler", StandardScaler()), # Step 1: Standardize features ("classifier", LogisticRegression()) # Step 2: Train classifier ]) # Fit the pipeline on training data pipeline.fit(X_train, y_train) # Predict on test data predictions = pipeline.predict(X_test) print("Pipeline accuracy:", pipeline.score(X_test, y_test))
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 6.67
Bygge Rørledninger med scikit-learn
Sveip for å vise menyen
Når du utvikler maskinlæringsløsninger, gjentar du ofte de samme trinnene: dataprosessering, feature engineering, modelltrening og evaluering. Å skrive disse trinnene separat kan føre til duplisering av kode og gjøre det vanskelig å reprodusere resultater. scikit-learn tilbyr klassen Pipeline, som lar deg kjede sammen prosesserings- og modelleringstrinn i én samlet arbeidsflyt. Denne tilnærmingen gjør koden din ryddigere, mer vedlikeholdbar og enklere å reprodusere.
En pipeline standardiserer ML-arbeidsflyten og reduserer kode duplisering.
12345678910111213141516171819202122232425262728import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.linear_model import LogisticRegression from sklearn.pipeline import Pipeline # Load sample data iris = load_iris() X = pd.DataFrame(iris.data, columns=iris.feature_names) y = iris.target # Split data X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42) # Create a pipeline with preprocessing and modeling steps pipeline = Pipeline([ ("scaler", StandardScaler()), # Step 1: Standardize features ("classifier", LogisticRegression()) # Step 2: Train classifier ]) # Fit the pipeline on training data pipeline.fit(X_train, y_train) # Predict on test data predictions = pipeline.predict(X_test) print("Pipeline accuracy:", pipeline.score(X_test, y_test))
Takk for tilbakemeldingene dine!