Scikit-Learn-Koncepter
Biblioteket scikit-learn (importeret som sklearn
) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn
-objekter er estimator, transformer, predictor og model.
Estimator
Hver klasse i sklearn
med metoden .fit()
betragtes som en estimator. Metoden .fit()
gør det muligt for et objekt at lære fra data.
Med andre ord bruges .fit()
-metoden til træning af et objekt. Den tager parametrene X
og y
(y
er valgfri for opgaver med ikke-superviseret læring).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.
Transformer
En transformer har metoderne .fit()
og .transform()
, som transformerer data på en bestemt måde.
Normalt skal transformers lære noget fra data før de kan transformere, så du skal anvende .fit()
og derefter .transform()
. For at undgå dette har transformers også metoden .fit_transform()
.
.fit_transform()
giver samme resultat som at anvende .fit()
og .transform()
sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformere bruges normalt til at transformere X
-arrayet. Men som vi vil se i eksemplet med LabelEncoder
, er nogle transformere lavet til y
-arrayet.
nan
-værdier vist i træningssættet på billedet angiver manglende data i Python.
Predictor
En predictor er en estimator (har metoden .fit()
) som også har metoden .predict()
. Metoden .predict()
anvendes til at lave forudsigelser.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Model
En model er en type predictor, der også inkluderer metoden .score()
. Denne metode beregner en score (metrik) til at måle predictorens præstation.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nævnt i det foregående kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.
Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.13
Scikit-Learn-Koncepter
Stryg for at vise menuen
Biblioteket scikit-learn (importeret som sklearn
) tilbyder forskellige funktioner og klasser til forbehandling af data og modellering. De vigtigste sklearn
-objekter er estimator, transformer, predictor og model.
Estimator
Hver klasse i sklearn
med metoden .fit()
betragtes som en estimator. Metoden .fit()
gør det muligt for et objekt at lære fra data.
Med andre ord bruges .fit()
-metoden til træning af et objekt. Den tager parametrene X
og y
(y
er valgfri for opgaver med ikke-superviseret læring).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Det er ikke særlig nyttigt, hvis et objekt kun lærer fra data uden at producere noget resultat. Mere praktiske er de to typer objekter, der arver fra estimator: transformer og predictor.
Transformer
En transformer har metoderne .fit()
og .transform()
, som transformerer data på en bestemt måde.
Normalt skal transformers lære noget fra data før de kan transformere, så du skal anvende .fit()
og derefter .transform()
. For at undgå dette har transformers også metoden .fit_transform()
.
.fit_transform()
giver samme resultat som at anvende .fit()
og .transform()
sekventielt, men er nogle gange hurtigere, så det foretrækkes frem for .fit().transform()
.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Transformere bruges normalt til at transformere X
-arrayet. Men som vi vil se i eksemplet med LabelEncoder
, er nogle transformere lavet til y
-arrayet.
nan
-værdier vist i træningssættet på billedet angiver manglende data i Python.
Predictor
En predictor er en estimator (har metoden .fit()
) som også har metoden .predict()
. Metoden .predict()
anvendes til at lave forudsigelser.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Model
En model er en type predictor, der også inkluderer metoden .score()
. Denne metode beregner en score (metrik) til at måle predictorens præstation.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Som nævnt i det foregående kapitel er accuracy en metrik, der repræsenterer procentdelen af korrekte forudsigelser.
Forbehandlingsfasen involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i modelleringsfasen.
Tak for dine kommentarer!