Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Scikit-Learn-Koncepter | Forbehandling af Data med Scikit-learn
ML Introduktion med Scikit-learn

bookScikit-Learn-Koncepter

Biblioteket scikit-learn (importeret som sklearn) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn-objekter er estimator, transformer, predictor og model.

Estimator

Hver klasse i sklearn med metoden .fit() betragtes som en estimator. Metoden .fit() gør det muligt for et objekt at lære fra data.

Med andre ord bruges .fit()-metoden til træning af et objekt. Den tager parametrene X og y (y er valgfri for opgaver med ikke-superviseret læring).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.

Transformer

En transformer har metoderne .fit() og .transform(), som transformerer data på en bestemt måde.

Normalt skal transformers lære noget fra data før de kan transformere, så du skal anvende .fit() og derefter .transform(). For at undgå dette har transformers også metoden .fit_transform().
.fit_transform() giver samme resultat som at anvende .fit() og .transform() sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Bemærk

Transformere bruges normalt til at transformere X-arrayet. Men som vi vil se i eksemplet med LabelEncoder, er nogle transformere lavet til y-arrayet.

nan-værdier vist i træningssættet på billedet angiver manglende data i Python.

Predictor

En predictor er en estimator (har metoden .fit()) som også har metoden .predict(). Metoden .predict() anvendes til at lave forudsigelser.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Model

En model er en type predictor, der også inkluderer metoden .score(). Denne metode beregner en score (metrik) til at måle predictorens præstation.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nævnt i det foregående kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.

Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.

question mark

Vælg alle korrekte udsagn.

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Awesome!

Completion rate improved to 3.13

bookScikit-Learn-Koncepter

Stryg for at vise menuen

Biblioteket scikit-learn (importeret som sklearn) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn-objekter er estimator, transformer, predictor og model.

Estimator

Hver klasse i sklearn med metoden .fit() betragtes som en estimator. Metoden .fit() gør det muligt for et objekt at lære fra data.

Med andre ord bruges .fit()-metoden til træning af et objekt. Den tager parametrene X og y (y er valgfri for opgaver med ikke-superviseret læring).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.

Transformer

En transformer har metoderne .fit() og .transform(), som transformerer data på en bestemt måde.

Normalt skal transformers lære noget fra data før de kan transformere, så du skal anvende .fit() og derefter .transform(). For at undgå dette har transformers også metoden .fit_transform().
.fit_transform() giver samme resultat som at anvende .fit() og .transform() sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform().

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Bemærk

Transformere bruges normalt til at transformere X-arrayet. Men som vi vil se i eksemplet med LabelEncoder, er nogle transformere lavet til y-arrayet.

nan-værdier vist i træningssættet på billedet angiver manglende data i Python.

Predictor

En predictor er en estimator (har metoden .fit()) som også har metoden .predict(). Metoden .predict() anvendes til at lave forudsigelser.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Model

En model er en type predictor, der også inkluderer metoden .score(). Denne metode beregner en score (metrik) til at måle predictorens præstation.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Som nævnt i det foregående kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.

Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.

question mark

Vælg alle korrekte udsagn.

Select the correct answer

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 1
some-alt